Получение количества строк и столбцов в кадре данных Pandas
DataFrames — это хорошо известная структура данных, предоставляемая библиотекой Python Pandas. Их можно использовать для хранения данных в двумерной табличной форме, что удобно для визуализации и манипулирования различными типами данных. Поскольку DataFrames являются двухмерными, они содержат строки и столбцы. В этой статье мы рассмотрим 3 различных метода подсчета строк и столбцов в DataFrame, а также несколько примеров.
Также читайте: 4 способа добавить столбец в DataFrame в Pandas (с примерами)
Методы подсчета количества строк и столбцов в Pandas
Библиотека Pandas предоставляет нам различные функции, которые могут помочь в подсчете количества строк и столбцов в DataFrame. Здесь мы подробно рассмотрим некоторые из следующих методов:
- Используя функцию
len() - Использование функции
len(df.axes[]) - Использование атрибута
shape
Давайте разберемся в этом подробно, подкрепив примерами для лучшего понимания.
1. Использование функции len()
Метод DataFrame.len() обычно используется для возврата количества строк в DataFrame. Однако, используя атрибут columns, который возвращает метки столбцов в DataFrame, которые можно снова посчитать с помощью len(), чтобы вернуть количество столбцов. Давайте лучше поймем это на примере.
Пример:
Мы начнем с импорта библиотеки pandas в наш файл и создания DataFrame.
import pandas as pd
dataframe = {'Fruit' : ['🍎','🍋','🍊'],
'Name' : ['Apple', 'Lemon', 'Orange']}
df = pd.DataFrame(dataframe)
print(df, "\n")
print("number of rows:",len(df))
print("number of columns:",len(df.columns))
Здесь у нас есть словарный фрейм данных, содержащий два ключа: Fruit и Name, а также список из трех соответствующих значений в каждом столбце. Этот словарь можно преобразовать в DataFrame с помощью метода DataFrame(), где ключи становятся столбцами DataFrame, а значения списка — строками. Возвращенный DataFrame сохраняется в df, и мы можем распечатать df, чтобы лучше визуализировать DataFrame.
Затем мы передаем df нашего DataFrame в функцию len(), которая возвращает количество строк. Чтобы получить количество столбцов, мы передаем df.columns в len().
Выход:
2. Использование функции len(df.axes[])
Простым вариантом использования len() отдельно для df и df.columns было бы использование атрибута df.axes, чтобы указать, по какой оси мы ведем подсчет. При использовании осей axes[0] представляют строки DataFrame, а axes[1] представляют столбцы DataFrame.
Пример:
import pandas as pd
dataframe = {'Fruit' : ['🍎','🍋','🍊'],
'Name' : ['Apple', 'Lemon', 'Orange']}
df = pd.DataFrame(dataframe)
print(df, "\n")
print("number of rows (using axes) :",len(df.axes[0]))
print("number of columns (using axes):",len(df.axes[1]))
Здесь мы использовали тот же пример, что и раньше, но заменили df и df.columns, переданные в функцию len(), соответствующими атрибутами осей. Мы начнем с импорта pandas и создания словаря данных. Этот словарь позже преобразуется в DataFrame с помощью функции DataFrame(). Затем мы передаем df.axes[0] в len() для вычисления количества строк и df.axes[1] для вычисления количества столбцов. Количество строк и столбцов остается таким же, как и в предыдущем примере.
Выход:
3. Использование атрибута формы
Атрибут shape в Datarame используется для возврата кортежа, содержащего количество строк и количество столбцов в форме – (количество строк, количество столбцов). Его также можно использовать для подсчета количества строк и столбцов отдельно с помощью осей. Давайте изменим последний пример, чтобы использовать форму.
Пример:
import pandas as pd
dataframe = {'Fruit' : ['🍎','🍋','🍊'],
'Name' : ['Apple', 'Lemon', 'Orange']}
df = pd.DataFrame(dataframe)
print(df, "\n")
print("shape of DataFrame: ", df.shape)
print("number of rows:",df.shape[0])
print("number of columns:",df.shape[1])
Здесь мы сначала импортировали библиотеку pandas и инициализировали словарь dataframe. Затем словарь преобразуется в DataFrame с помощью метода DataFrame, который преобразует ключи словаря в строки DataFrame, а список значений — в строки. DataFrame хранится в df.
Теперь мы можем использовать df для доступа к атрибуту формы. Мы используем этот атрибут для печати общей формы с помощью df.shape, который возвращается в виде кортежа, содержащего как строки, так и столбцы. Затем мы используем его вдоль осей, чтобы отдельно распечатать строки, используя df.axes[0] и столбцы, используя df.axes[1].
Выход:
Заключение
DataFrames являются неотъемлемой частью Pandas, которая помогает структурировать данные четко и легко для понимания. Следовательно, важно знать, как выполнять основные функции с DataFrame, такие как возврат количества строк и количества столбцов данного DataFrame. В этой статье мы рассмотрели 3 простых способа подсчета количества строк и столбцов с помощью функции len(), использования атрибута axes и передачи его в len() и, наконец, использования атрибута shape.