Как построить фреймворк Pandas с помощью Matplotlib?
Предпосылки:
- Панды
- Матплотлиб
Визуализация данных - самая важная часть любого анализа. Matplotlib - потрясающая библиотека Python, которую можно использовать для построения фрейма данных pandas. Существуют различные способы создания сюжета в зависимости от требований.
Сравнение категориальных данных
Гистограмма - один из таких примеров. Для построения гистограммы будет использоваться функция plot ().
Синтаксис:
matplotlib.pyplot.plot(*args, scalex=True, scaley=True, data=None, **kwargs)
Пример:
Python3
# importing pandas libraryimport pandas as pd# importing matplotlib libraryimport matplotlib.pyplot as plt # creating dataframedf = pd.DataFrame({ 'Name' : [ 'John' , 'Sammy' , 'Joe' ], 'Age' : [ 45 , 38 , 90 ]}) # plotting a bar graphdf.plot(x = "Name" , y = "Age" , kind = "bar" ) |
Выход:

Визуализация непрерывных данных
Гистограмма - это пример представления данных, разделенных на тесно связанные интервалы. Для этого будет использоваться функция hist ().
Синтаксис:
matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype=’bar’, align=’mid’, orientation=’vertical’, rwidth=None, log=False, color=None, label=None, stacked=False, *, data=None, **kwargs)
Пример:
Python3
# importing pandas libraryimport pandas as pd# importing matplotlib libraryimport matplotlib.pyplot as plt # creating dataframedf = pd.DataFrame({ "Age": [45, 38, 90, 60, 40, 50, 2, 32, 8, 15, 27, 69, 73, 55]}) # plotting a histogramplt.hist(df["Age"])plt.show() |
Выход:

Для распространения данных
Круговая диаграмма - отличный способ представления данных, которые являются частью целого. Для построения круговой диаграммы будет использоваться функция pie ().
Синтаксис:
matplotlib.pyplot.pie(data, explode=None, labels=None, colors=None, autopct=None, shadow=False)
Пример:
Python3
# importing pandas libraryimport pandas as pd# importing matplotlib libraryimport matplotlib.pyplot as plt # creating dataframedf = pd.DataFrame({ 'Object' : [ 'Bulb' , 'Lamp' , 'Table' , 'Pen' , 'Notebook' ], 'Price' : [ 45 , 38 , 90 , 60 , 40 ]}) # plotting a pie chartplt.pie(df[ "Price" ], labels = df[ "Object" ])plt.show() |
Выход:

Зависимость данных
В ситуациях, когда данные должны интерпретироваться в зависимости от зависимых и независимых параметров, используются графики, такие как линейная диаграмма или точечная диаграмма. Для построения линейного графика достаточно функции plot (), но для визуализации диаграммы рассеяния используется функция scatter ().
Синтаксис:
matplotlib.pyplot.scatter(x_axis_data, y_axis_data, s=None, c=None, marker=None, cmap=None, vmin=None, vmax=None, alpha=None, linewidths=None, edgecolors=None)
Пример:
Python3
# importing pandas libraryimport pandas as pd# importing matplotlib libraryimport matplotlib.pyplot as plt # creating dataframedf = pd.DataFrame({ 'X' : [ 1 , 2 , 3 , 4 , 5 ], 'Y' : [ 2 , 4 , 6 , 10 , 15 ]}) # plotting a line graphprint ( "Line graph: " )plt.plot(df[ "X" ], df[ "Y" ])plt.show() # plotting a scatter plotprint ( "Scatter Plot: " )plt.scatter(df[ "X" ], df[ "Y" ])plt.show() |
Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.