Как построить фреймворк Pandas с помощью Matplotlib?
Предпосылки:
- Панды
- Матплотлиб
Визуализация данных - самая важная часть любого анализа. Matplotlib - потрясающая библиотека Python, которую можно использовать для построения фрейма данных pandas. Существуют различные способы создания сюжета в зависимости от требований.
Сравнение категориальных данных
Гистограмма - один из таких примеров. Для построения гистограммы будет использоваться функция plot ().
Синтаксис:
matplotlib.pyplot.plot(*args, scalex=True, scaley=True, data=None, **kwargs)
Пример:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'Name' : [ 'John' , 'Sammy' , 'Joe' ], 'Age' : [ 45 , 38 , 90 ] }) # plotting a bar graph df.plot(x = "Name" , y = "Age" , kind = "bar" ) |
Выход:
Визуализация непрерывных данных
Гистограмма - это пример представления данных, разделенных на тесно связанные интервалы. Для этого будет использоваться функция hist ().
Синтаксис:
matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype=’bar’, align=’mid’, orientation=’vertical’, rwidth=None, log=False, color=None, label=None, stacked=False, *, data=None, **kwargs)
Пример:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ "Age" : [ 45 , 38 , 90 , 60 , 40 , 50 , 2 , 32 , 8 , 15 , 27 , 69 , 73 , 55 ] }) # plotting a histogram plt.hist(df[ "Age" ]) plt.show() |
Выход:
Для распространения данных
Круговая диаграмма - отличный способ представления данных, которые являются частью целого. Для построения круговой диаграммы будет использоваться функция pie ().
Синтаксис:
matplotlib.pyplot.pie(data, explode=None, labels=None, colors=None, autopct=None, shadow=False)
Пример:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'Object' : [ 'Bulb' , 'Lamp' , 'Table' , 'Pen' , 'Notebook' ], 'Price' : [ 45 , 38 , 90 , 60 , 40 ] }) # plotting a pie chart plt.pie(df[ "Price" ], labels = df[ "Object" ]) plt.show() |
Выход:
Зависимость данных
В ситуациях, когда данные должны интерпретироваться в зависимости от зависимых и независимых параметров, используются графики, такие как линейная диаграмма или точечная диаграмма. Для построения линейного графика достаточно функции plot (), но для визуализации диаграммы рассеяния используется функция scatter ().
Синтаксис:
matplotlib.pyplot.scatter(x_axis_data, y_axis_data, s=None, c=None, marker=None, cmap=None, vmin=None, vmax=None, alpha=None, linewidths=None, edgecolors=None)
Пример:
Python3
# importing pandas library import pandas as pd # importing matplotlib library import matplotlib.pyplot as plt # creating dataframe df = pd.DataFrame({ 'X' : [ 1 , 2 , 3 , 4 , 5 ], 'Y' : [ 2 , 4 , 6 , 10 , 15 ] }) # plotting a line graph print ( "Line graph: " ) plt.plot(df[ "X" ], df[ "Y" ]) plt.show() # plotting a scatter plot print ( "Scatter Plot: " ) plt.scatter(df[ "X" ], df[ "Y" ]) plt.show() |
Выход:
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.