Как построить фреймворк Pandas с помощью Matplotlib?

Опубликовано: 14 Декабря, 2021

Предпосылки:

  • Панды
  • Матплотлиб

Визуализация данных - самая важная часть любого анализа. Matplotlib - потрясающая библиотека Python, которую можно использовать для построения фрейма данных pandas. Существуют различные способы создания сюжета в зависимости от требований.

Сравнение категориальных данных

Гистограмма - один из таких примеров. Для построения гистограммы будет использоваться функция plot ().

Синтаксис:

matplotlib.pyplot.plot(*args, scalex=True, scaley=True, data=None, **kwargs)

Пример:

Python3

# importing pandas library
import pandas as pd
# importing matplotlib library
import matplotlib.pyplot as plt
# creating dataframe
df = pd.DataFrame({
'Name' : [ 'John' , 'Sammy' , 'Joe' ],
'Age' : [ 45 , 38 , 90 ]
})
# plotting a bar graph
df.plot(x = "Name" , y = "Age" , kind = "bar" )

Выход:

Визуализация непрерывных данных

Гистограмма - это пример представления данных, разделенных на тесно связанные интервалы. Для этого будет использоваться функция hist ().

Синтаксис:

matplotlib.pyplot.hist(x, bins=None, range=None, density=False, weights=None, cumulative=False, bottom=None, histtype=’bar’, align=’mid’, orientation=’vertical’, rwidth=None, log=False, color=None, label=None, stacked=False, *, data=None, **kwargs)

Пример:

Python3

# importing pandas library
import pandas as pd
# importing matplotlib library
import matplotlib.pyplot as plt
  
# creating dataframe
df = pd.DataFrame({
    "Age": [45, 38, 90, 60, 40, 50, 2, 32, 8, 15, 27, 69, 73, 55]
})
  
# plotting a histogram
plt.hist(df["Age"])
plt.show()

Выход:

Для распространения данных

Круговая диаграмма - отличный способ представления данных, которые являются частью целого. Для построения круговой диаграммы будет использоваться функция pie ().

Синтаксис:

matplotlib.pyplot.pie(data, explode=None, labels=None, colors=None, autopct=None, shadow=False)

Пример:

Python3

# importing pandas library
import pandas as pd
# importing matplotlib library
import matplotlib.pyplot as plt
# creating dataframe
df = pd.DataFrame({
'Object' : [ 'Bulb' , 'Lamp' , 'Table' , 'Pen' , 'Notebook' ],
'Price' : [ 45 , 38 , 90 , 60 , 40 ]
})
# plotting a pie chart
plt.pie(df[ "Price" ], labels = df[ "Object" ])
plt.show()

Выход:

Зависимость данных

В ситуациях, когда данные должны интерпретироваться в зависимости от зависимых и независимых параметров, используются графики, такие как линейная диаграмма или точечная диаграмма. Для построения линейного графика достаточно функции plot (), но для визуализации диаграммы рассеяния используется функция scatter ().

Синтаксис:

matplotlib.pyplot.scatter(x_axis_data, y_axis_data, s=None, c=None, marker=None, cmap=None, vmin=None, vmax=None, alpha=None, linewidths=None, edgecolors=None)

Пример:

Python3

# importing pandas library
import pandas as pd
# importing matplotlib library
import matplotlib.pyplot as plt
# creating dataframe
df = pd.DataFrame({
'X' : [ 1 , 2 , 3 , 4 , 5 ],
'Y' : [ 2 , 4 , 6 , 10 , 15 ]
})
# plotting a line graph
print ( "Line graph: " )
plt.plot(df[ "X" ], df[ "Y" ])
plt.show()
# plotting a scatter plot
print ( "Scatter Plot: " )
plt.scatter(df[ "X" ], df[ "Y" ])
plt.show()

Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.