Python - правило 68-95-99.7 в статистике
Эмпирическое правило (также называемое правилом 68-95-99.7 или правилом трех сигм ) утверждает, что для любого нормального распределения мы имеем следующие наблюдения:
- 68% наблюдаемых значений лежат между 1 стандартным отклонением от среднего:
- 95% наблюдаемых значений лежат между 2 стандартными отклонениями от среднего:
- 99,7% наблюдаемых значений лежат между 3 стандартными отклонениями от среднего:
Ниже приведен стандартный график нормального распределения с (среднее значение = 0 и стандартное отклонение = 1 ), иллюстрирующий эмпирическое правило.
Мы можем проверить это с помощью функций, предоставляемых модулем Python SciPy.
Мы можем использовать функцию cdf () модуля scipy.stats.norm для вычисления кумулятивной вероятности (площадь под кривой распределения).
Syntax : cdf(x, mean, SD)
Parameters :
- x : value up to which cumulative probability is to be calculated
- mean : mean of the distribution
- SD : standard deviation of the distribution
Ниже представлена реализация:
import matplotlib.pyplot as plt import numpy as np from scipy.stats import norm # setting the values of # mean and SD mean = 0 SD = 1 # value of cdf between one, two # and three SD around the mean one_sd = norm.cdf(SD, mean, SD) - norm.cdf( - SD, mean, SD) two_sd = norm.cdf( 2 * SD, mean, SD) - norm.cdf( - 2 * SD, mean, SD) three_sd = norm.cdf( 3 * SD, mean, SD) - norm.cdf( - 3 * SD, mean, SD) # printing the value of fractions # within each band print ( "Fracton of values within one SD =" , one_sd) print ( "Fracton of values within two SD =" , two_sd) print ( "Fracton of values within three SD =" , three_sd) |
Выход :
Фрактон значений в пределах одного SD = 0,6826894921370859 Фрактон значений в пределах двух SD = 0,9544997361036416 Фрактон значений в пределах трех SD = 0,9973002039367398
Отсюда мы видим, что доли значений практически равны 0,65 , 0,95 и 0,997 . Таким образом, эмпирическое Правило проверено.
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.