Получение количества строк и столбцов в кадре данных Pandas
DataFrames — это хорошо известная структура данных, предоставляемая библиотекой Python Pandas. Их можно использовать для хранения данных в двумерной табличной форме, что удобно для визуализации и манипулирования различными типами данных. Поскольку DataFrames являются двухмерными, они содержат строки и столбцы. В этой статье мы рассмотрим 3 различных метода подсчета строк и столбцов в DataFrame, а также несколько примеров.
Также читайте: 4 способа добавить столбец в DataFrame в Pandas (с примерами)
Методы подсчета количества строк и столбцов в Pandas
Библиотека Pandas предоставляет нам различные функции, которые могут помочь в подсчете количества строк и столбцов в DataFrame. Здесь мы подробно рассмотрим некоторые из следующих методов:
- Используя функцию
len()
- Использование функции
len(df.axes[])
- Использование атрибута
shape
Давайте разберемся в этом подробно, подкрепив примерами для лучшего понимания.
1. Использование функции len()
Метод DataFrame.len()
обычно используется для возврата количества строк в DataFrame. Однако, используя атрибут columns
, который возвращает метки столбцов в DataFrame, которые можно снова посчитать с помощью len()
, чтобы вернуть количество столбцов. Давайте лучше поймем это на примере.
Пример:
Мы начнем с импорта библиотеки pandas в наш файл и создания DataFrame.
import pandas as pd
dataframe = {'Fruit' : ['🍎','🍋','🍊'],
'Name' : ['Apple', 'Lemon', 'Orange']}
df = pd.DataFrame(dataframe)
print(df, "\n")
print("number of rows:",len(df))
print("number of columns:",len(df.columns))
Здесь у нас есть словарный фрейм данных, содержащий два ключа: Fruit и Name, а также список из трех соответствующих значений в каждом столбце. Этот словарь можно преобразовать в DataFrame с помощью метода DataFrame()
, где ключи становятся столбцами DataFrame, а значения списка — строками. Возвращенный DataFrame сохраняется в df, и мы можем распечатать df, чтобы лучше визуализировать DataFrame.
Затем мы передаем df нашего DataFrame в функцию len()
, которая возвращает количество строк. Чтобы получить количество столбцов, мы передаем df.columns
в len()
.
Выход:
2. Использование функции len(df.axes[])
Простым вариантом использования len()
отдельно для df
и df.columns
было бы использование атрибута df.axes, чтобы указать, по какой оси мы ведем подсчет. При использовании осей axes[0]
представляют строки DataFrame, а axes[1]
представляют столбцы DataFrame.
Пример:
import pandas as pd
dataframe = {'Fruit' : ['🍎','🍋','🍊'],
'Name' : ['Apple', 'Lemon', 'Orange']}
df = pd.DataFrame(dataframe)
print(df, "\n")
print("number of rows (using axes) :",len(df.axes[0]))
print("number of columns (using axes):",len(df.axes[1]))
Здесь мы использовали тот же пример, что и раньше, но заменили df
и df.columns
, переданные в функцию len()
, соответствующими атрибутами осей. Мы начнем с импорта pandas и создания словаря данных. Этот словарь позже преобразуется в DataFrame с помощью функции DataFrame()
. Затем мы передаем df.axes[0]
в len()
для вычисления количества строк и df.axes[1]
для вычисления количества столбцов. Количество строк и столбцов остается таким же, как и в предыдущем примере.
Выход:
3. Использование атрибута формы
Атрибут shape
в Datarame используется для возврата кортежа, содержащего количество строк и количество столбцов в форме – (количество строк, количество столбцов). Его также можно использовать для подсчета количества строк и столбцов отдельно с помощью осей. Давайте изменим последний пример, чтобы использовать форму.
Пример:
import pandas as pd
dataframe = {'Fruit' : ['🍎','🍋','🍊'],
'Name' : ['Apple', 'Lemon', 'Orange']}
df = pd.DataFrame(dataframe)
print(df, "\n")
print("shape of DataFrame: ", df.shape)
print("number of rows:",df.shape[0])
print("number of columns:",df.shape[1])
Здесь мы сначала импортировали библиотеку pandas и инициализировали словарь dataframe. Затем словарь преобразуется в DataFrame с помощью метода DataFrame, который преобразует ключи словаря в строки DataFrame, а список значений — в строки. DataFrame хранится в df
.
Теперь мы можем использовать df для доступа к атрибуту формы. Мы используем этот атрибут для печати общей формы с помощью df.shape
, который возвращается в виде кортежа, содержащего как строки, так и столбцы. Затем мы используем его вдоль осей, чтобы отдельно распечатать строки, используя df.axes[0]
и столбцы, используя df.axes[1]
.
Выход:
Заключение
DataFrames являются неотъемлемой частью Pandas, которая помогает структурировать данные четко и легко для понимания. Следовательно, важно знать, как выполнять основные функции с DataFrame, такие как возврат количества строк и количества столбцов данного DataFrame. В этой статье мы рассмотрели 3 простых способа подсчета количества строк и столбцов с помощью функции len()
, использования атрибута axes и передачи его в len()
и, наконец, использования атрибута shape
.