Оценка переменной | набор 1
Изменчивость: это измерение импорта, которое измеряет вариацию данных, т.е. являются ли данные распределенными или сильно сгруппированными. Также известна как дисперсия. При работе с наборами данных в машинном обучении или науке о данных она включает в себя много шагов - измерение дисперсии, сокращение, различение случайной изменчивости от реальной. выявление источников реальной изменчивости, принятие решений относительно выбора предварительной обработки или выбора модели на ее основе.
Термины, относящиеся к показателям изменчивости:
-> Отклонение -> Дисперсия -> Стандартное отклонение -> Среднее абсолютное отклонение -> Меадианское абсолютное отклонение -> Статистика заказов -> Диапазон -> Процентиль -> Межквартильный диапазон
- Отклонение: мы также можем назвать это ошибками или остатками. Это мера того, насколько значения отличаются / рассредоточены от центрального / наблюдаемого значения.
Пример :Последовательность: [2, 3, 5, 6, 7, 9] Предположим, центральное / наблюдаемое значение = 7 Отклонение = [-5, -4, -2, -1, 0, 2]
- Дисперсия (s 2 ): это наиболее известный показатель для оценки изменчивости, поскольку он представляет собой квадратичное отклонение. Это можно назвать среднеквадратической ошибкой, поскольку это среднее значение стандартного отклонения.
Пример :Последовательность: [2, 3, 5, 6, 7, 9] Среднее = 5,33 Всего терминов, n = 6 Квадратное отклонение = (2 - 5,33) 2 + (3 - 5,33) 2 + (5 - 5,33) 2 (6 - 5,33) 2 + (7 - 5,33) 2 + (9 - 5,33) 2 Дисперсия = Квадратное отклонение / n
Код -
# Variance
import
numpy as np
Sequence
=
[
2
,
3
,
5
,
6
,
7
,
9
]
var
=
np.var(Sequence)
print
(
"Variance : "
, var)
Выход :
Отклонение: 5.5555555555555545
- Стандартное отклонение: это квадратный корень из дисперсии. Также упоминается как Евклидова норма .
Пример :
Последовательность: [2, 3, 5, 6, 7, 9] Среднее = 5,33 Всего терминов, n = 6 Квадратное отклонение = (2 - 5,33) 2 + (3 - 5,33) 2 + (5 - 5,33) 2 (6 - 5,33) 2 + (7 - 5,33) 2 + (9 - 5,33) 2 Дисперсия = Квадратное отклонение / n Стандартное отклонение = (дисперсия) 1/2
Код -
# Standard Deviation
import
numpy as np
Sequence
=
[
2
,
3
,
5
,
6
,
7
,
9
]
std
=
np.std(Sequence)
print
(
"Standard Deviation : "
, std)
Выход :
Стандартное отклонение: 2,357022603955158
- Среднее абсолютное отклонение: можно оценить типичную оценку этих отклонений. Если мы усредним значения, отрицательные отклонения компенсируют положительные. Кроме того, сумма отклонений от среднего всегда равна нулю. Итак, это простой подход - взять среднее значение самого отклонения.
Пример :Последовательность: [2, 4, 6, 8] Среднее = 5 Отклонение от среднего значения = [-3, -1, 1, 3] Среднее абсолютное отклонение = (3 + 1 + 1 + 3) / 4
# Mean Absolute Deviation
import
numpy as np
def
mad(data):
return
np.mean(np.absolute(
data
-
np.mean(data)))
Sequence
=
[
2
,
4
,
6
,
8
]
print
(
"Mean Absolute Deviation : "
, mad(Sequence))
Выход :
Среднее абсолютное отклонение: 2,0
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.