Полное руководство по Bamboolib - инструменту с графическим интерфейсом для анализа фреймов данных Pandas
![](/static/storage/113884615976881906489749807511186878137.jpeg)
Анализ и визуализация данных - самый важный и трудоемкий процесс. Нам нужно потратить много времени, чтобы четко проанализировать, о чем эти данные и что они пытаются рассказать. Мы используем различные типы библиотек и функций Python для визуализации шаблонов и аномалий в наборе данных, чтобы познакомиться с набором данных.
Bamboolib - это графический интерфейс для pandas DataFrames, который позволяет любому работать с python в Jupyter Notebook или JupyterLab. Bamboolib - очень интерактивная и очень полезная библиотека для анализа, визуализации и управления данными. Даже человек, не имеющий технических знаний, может использовать его для анализа данных, потому что он не требует никакого опыта программирования.
Bamboolib используется более чем 100 компаниями и позволяет аналитикам данных работать с Python даже без написания кода. Bamboolib не является открытым исходным кодом, что означает, что вам нужно купить bamboolib, чтобы использовать его, но он предоставляет 14-дневную бесплатную пробную версию, чтобы вы могли полностью изучить его и увидеть, как он может быть полезен для вас.
В этой статье мы рассмотрим различные варианты использования бамбулиба и увидим, как он экономит время и силы. Мы рассмотрим различные функции, которые предоставляет bamboolib, а также экспортируем код, используемый для этих функций.
Реализация бамбулиба:
Для изучения бамбулиба нам сначала нужно зарегистрироваться на их веб-сайте, чтобы получить 14-дневную бесплатную пробную версию. После регистрации вы получите письмо с ключом активации на зарегистрированный адрес электронной почты. Как и любую другую библиотеку python, нам нужно установить bamboolib с помощью:
pip install bamboolib
1. Импорт необходимых библиотек
Нам нужно будет импортировать pandas для загрузки набора данных и bamboolib для визуализации набора данных.
import bamboolib as bam
import pandas as pd
2. Загрузка набора данных
Здесь мы будем использовать набор данных о конструкции автомобиля, который содержит различные атрибуты, относящиеся к компаниям-производителям автомобилей. Вы можете скачать этот набор данных с Kaggle. Мы будем использовать pandas для загрузки этого набора данных.
df = pd.read_csv(‘car_design.csv’)
3. Анализ набора данных
Это основной шаг, на котором мы проанализируем и визуализируем набор данных с помощью bamboolib.
bam.show(df)
![](/static/storage/77854590987233478202877782166648196674.png)
Перед использованием bamboolib нам необходимо активировать его в нашем блокноте jupyter, введя зарегистрированный идентификатор электронной почты и код активации, полученные по электронной почте. После нажатия кнопки отправки bamboolib будет активирован, и нам нужно повторно запустить команду show.
bam.show(df)
![](/static/storage/266222167751005888117179318840227718682.png)
Как видите, это графический интерфейс пользователя, предоставляемый bamboolib. Теперь давайте исследуем различные разделы интерфейса Bamboolib.
Изучение Dataframe
Нам нужно щелкнуть фрейм данных исследования, чтобы получить подробный отчет о наборе данных и содержащихся в нем атрибутах.
![](/static/storage/147760759128193010836004889480693092186.png)
Здесь мы можем увидеть такие свойства, как тип данных, отсутствующие значения различных атрибутов и т.д.
Точно так же мы можем изучить взаимосвязь между различными атрибутами, визуализировав тепловую карту, которая отображается на вкладке матрицы.
![](/static/storage/10170160400445515018707895151650230826.png)
Создание графиков
Раздел Create plots позволяет нам создавать разные графики между разными атрибутами. Нам просто нужно выбрать тип графика, который нам нужно создать, и атрибуты, для которых нам нужно создать график. Кроме того, мы также можем выбрать различные параметры.
![](/static/storage/269408685557302466970489775319893991885.png)
Как видите, это диаграмма рассеивания атрибута length, созданная с помощью bamboolib. Вы можете видеть, что bamboolib также предоставляет вам код, необходимый для создания этих графиков, который может оказаться большим подспорьем, если вы новичок в python и узнаете о нем.
Поскольку bamboolib использует Plotly для визуализации, все созданные графики очень интерактивны и доступны для загрузки. Кроме того, он поддерживает все основные типы графиков, так что вы можете визуализировать закономерности, аномалии и выбросы в данных.
Трансформации
Мы можем выбрать различные преобразования, такие как фильтры, сортировку, группировку и т.д., которые будут применяться к нашему набору данных, используя вкладку преобразования. Преобразование можно использовать для управления вашими данными с помощью большого количества операций.
Давайте посмотрим, какие преобразования мы можем применить.
- Выбрать или отбросить столбец
Используя это преобразование, мы можем выбирать разные столбцы для анализа или отбрасывать столбцы, которые не хотим анализировать или которые не имеют отношения к делу.
![](/static/storage/123014194266448539363095258860388125006.png)
- Изменить тип данных
Это преобразование позволяет одним щелчком мыши изменить тип данных любого столбца на требуемый тип данных.
![](/static/storage/256353052639922642998804278604330253090.png)
- Отбросьте отсутствующие значения
Это преобразование используется для удаления всех недостающих данных во всем наборе данных или в определенном атрибуте.
![](/static/storage/99088236321964258487865382753885952346.png)
5. Предложения
Bamboolib также предлагает вам варианты различных атрибутов, когда мы дважды щелкаем любой из атрибутов в табличной форме. Он предлагает такие предложения, как изменение имени, значения и т.д.
![](/static/storage/74472249437779940485261435342312767548.png)
Точно так же вы можете использовать различные преобразования в соответствии с нашими требованиями.