Оценка переменной | набор 1

Опубликовано: 25 Июля, 2021

Изменчивость: это измерение импорта, которое измеряет вариацию данных, т.е. являются ли данные распределенными или сильно сгруппированными. Также известна как дисперсия. При работе с наборами данных в машинном обучении или науке о данных она включает в себя много шагов - измерение дисперсии, сокращение, различение случайной изменчивости от реальной. выявление источников реальной изменчивости, принятие решений относительно выбора предварительной обработки или выбора модели на ее основе.

Термины, относящиеся к показателям изменчивости:

-> Отклонение 
-> Дисперсия
-> Стандартное отклонение
-> Среднее абсолютное отклонение
-> Меадианское абсолютное отклонение
-> Статистика заказов
-> Диапазон
-> Процентиль 
-> Межквартильный диапазон
  • Отклонение: мы также можем назвать это ошибками или остатками. Это мера того, насколько значения отличаются / рассредоточены от центрального / наблюдаемого значения.
    Пример :
    Последовательность: [2, 3, 5, 6, 7, 9] 
    Предположим, центральное / наблюдаемое значение = 7
    
    Отклонение = [-5, -4, -2, -1, 0, 2]
    
  • Дисперсия (s 2 ): это наиболее известный показатель для оценки изменчивости, поскольку он представляет собой квадратичное отклонение. Это можно назвать среднеквадратической ошибкой, поскольку это среднее значение стандартного отклонения.

    Пример :
    Последовательность: [2, 3, 5, 6, 7, 9] 
    Среднее = 5,33
    Всего терминов, n = 6
    Квадратное отклонение = (2 - 5,33) 2 + (3 - 5,33) 2 + (5 - 5,33) 2
                        (6 - 5,33) 2 + (7 - 5,33) 2 + (9 - 5,33) 2
    Дисперсия = Квадратное отклонение / n
    

    Код -




    # Variance
    import numpy as np
    Sequence = [ 2 , 3 , 5 , 6 , 7 , 9 ]
    var = np.var(Sequence)
    print ( "Variance : " , var)

    Выход :

    Отклонение: 5.5555555555555545
  • Стандартное отклонение: это квадратный корень из дисперсии. Также упоминается как Евклидова норма .

    Пример :

    Последовательность: [2, 3, 5, 6, 7, 9] 
    Среднее = 5,33
    Всего терминов, n = 6
    Квадратное отклонение = (2 - 5,33) 2 + (3 - 5,33) 2 + (5 - 5,33) 2
                        (6 - 5,33) 2 + (7 - 5,33) 2 + (9 - 5,33) 2
    
    Дисперсия = Квадратное отклонение / n
    Стандартное отклонение = (дисперсия) 1/2
    

    Код -




    # Standard Deviation
    import numpy as np
    Sequence = [ 2 , 3 , 5 , 6 , 7 , 9 ]
    std = np.std(Sequence)
    print ( "Standard Deviation : " , std)

    Выход :

    Стандартное отклонение: 2,357022603955158
  • Среднее абсолютное отклонение: можно оценить типичную оценку этих отклонений. Если мы усредним значения, отрицательные отклонения компенсируют положительные. Кроме того, сумма отклонений от среднего всегда равна нулю. Итак, это простой подход - взять среднее значение самого отклонения.

    Пример :
    Последовательность: [2, 4, 6, 8] 
    Среднее = 5
    Отклонение от среднего значения = [-3, -1, 1, 3]
    
    Среднее абсолютное отклонение = (3 + 1 + 1 + 3) / 4
    




    # Mean Absolute Deviation
    import numpy as np
    def mad(data):
    return np.mean(np.absolute(
    data - np.mean(data)))
    Sequence = [ 2 , 4 , 6 , 8 ]
    print ( "Mean Absolute Deviation : " , mad(Sequence))

    Выход :

    Среднее абсолютное отклонение: 2,0

    Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

    Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.