Ящичный график и исследование гистограммы на данных радужной оболочки глаза

Опубликовано: 25 Июля, 2021

Атрибут Информация о наборе данных:

Информация об атрибутах:
   -> длина чашелистика в см
   -> ширина чашелистника в см
   -> длина лепестка в см
   -> ширина лепестка в см
   -> класс: 
              Ирис Сетоса
              Ирис разноцветный
              Ирис Вирджиния

Количество экземпляров: 150 

Сводные статистические данные:
             Корреляция минимального максимального среднего SD класса
   длина чашелистика: 4,3 7,9 5,84 0,83 0,7826   
    ширина чашелистика: 2,0 4,4 3,05 0,43 -0,4194
   длина лепестка: 1,0 6,9 3,76 1,76 0,9490 (высокая!)
    ширина лепестка: 0,1 2,5 1,20 0,76 0,9565 (высокий!)

Распределение по классам: 33,3% по каждому из 3 классов.

Чтобы получить данные по радужной оболочке, щелкните здесь.

Загрузка библиотек




import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

Загрузка данных




data = pd.read_csv( "Iris.csv" )
print (data.head( 10 ))

Выход:

Описание




data.describe()

Выход:

Информация




data.info()

Выход:


Код # 1: Гистограмма длины чашелистики




plt.figure(figsize = ( 10 , 7 ))
x = data[ "SepalLengthCm" ]
plt.hist(x, bins = 20 , color = "green" )
plt.title( "Sepal Length in cm" )
plt.xlabel( "Sepal_Length_cm" )
plt.ylabel( "Count" )

Выход:

Код # 2: Гистограмма ширины чашелистики




plt.figure(figsize = ( 10 , 7 ))
x = data.SepalWidthCm
plt.hist(x, bins = 20 , color = "green" )
plt.title( "Sepal Width in cm" )
plt.xlabel( "Sepal_Width_cm" )
plt.ylabel( "Count" )
plt.show()

Выход:

Код # 3: Гистограмма длины лепестка




plt.figure(figsize = (10, 7))
x = data.PetalLengthCm
  
plt.hist(x, bins = 20, color = "green")
plt.title("Petal Length in cm")
plt.xlabel("Petal_Length_cm")
plt.ylabel("Count")
  
plt.show()

Выход:

Код # 4: Гистограмма ширины лепестка




plt.figure(figsize = ( 10 , 7 ))
x = data.PetalWidthCm
plt.hist(x, bins = 20 , color = "green" )
plt.title( "Petal Width in cm" )
plt.xlabel( "Petal_Width_cm" )
plt.ylabel( "Count" )
plt.show()

Выход:

Код # 5: Подготовка данных для коробчатой диаграммы




# removing Id column
new_data = data[[ "SepalLengthCm" , "SepalWidthCm" , "PetalLengthCm" , "PetalWidthCm" ]]
print (new_data.head())

Выход :

Код # 6: Ящичная диаграмма для данных радужной оболочки глаза




plt.figure(figsize = ( 10 , 7 ))
new_data.boxplot()

Выход :

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.