Распределение Стьюдента в статистике

Опубликовано: 30 Ноября, 2021

T-распределение Стьюдента или t-распределение - это распределение вероятностей, которое используется для расчета параметров генеральной совокупности, когда размер выборки невелик и когда дисперсия генеральной совокупности неизвестна. Теоретическая работа по t-распределению была проведена WS Gosset ; свои выводы он опубликовал под псевдонимом « Студент ». Вот почему он называется t-критерием Стьюдента .

Это выборочное распределение t-статистики. Значения t-статистики выражаются следующим образом:

 t = [x̄ - μ] / [s / sqrt (n)]

где,
t = t оценка
x̄ = выборочное среднее,
μ = среднее значение по совокупности,
s = стандартное отклонение выборки,
n = размер выборки

Когда использовать t-распределение?

Распределение Стьюдента используется, когда

Размер выборки должен быть 30 или меньше 30.
Стандартное отклонение совокупности (σ) неизвестно.
Распределение населения должно быть одномодальным и асимметричным.

Математический вывод t-распределения:

T-распределение было получено математически в предположении нормально распределенной совокупности, и формула или уравнение будут такими:

f(t) = c(1+(t²/ν))^{(-ν+1) / 2}
where,
c = Constant required to make the area under the curve equal to unity
ν = Degrees of freedom

Таким образом, это уравнение указывает на функцию плотности вероятности (pdf) распределения t для ν степеней свободы.

Свойства t-распределения:

Приведенная выше диаграмма показывает, что синяя цветовая кривая является стандартной кривой нормального распределения или кривой распределения Z, потому что размер выборки (n) больше 30. А красная цветовая кривая является кривой t-распределения, потому что размер выборки (n) близко к 30. Точно так же кривая зеленого цвета также является кривой t-распределения, потому что размер выборки (n) меньше 30.

T-распределение обладает следующими свойствами:

Переменная в t-распределении изменяется от -∞ до + ∞ ( -∞ <t <+ ∞ ).
t-распределение будет симметричным, как и нормальное распределение, если степень t четна в функции плотности вероятности (pdf).
Для больших значений ν (т.е. увеличенного размера выборки n); t-распределение стремится к стандартному нормальному распределению. Это означает, что для разных значений ν форма t-распределения также различается.
T-распределение имеет менее пики, чем нормальное распределение в центре, и более высокое пиковое значение в хвостах. Из приведенной выше диаграммы можно заметить, что красная и зеленая кривые имеют меньше пиков в центре, но более высокие пики на хвостах, чем синяя кривая.
Значение y (высота пика) достигает максимального значения при μ = 0, как можно видеть на приведенной выше диаграмме.
Среднее значение распределения равно 0 для ν> 1, где ν = степени свободы, в противном случае не определено.
Медиана и мода распределения равны 0.
Дисперсия равна ν / ν-2 для ν> 2 и ∞ для 2 <ν ≤ 4 в противном случае не определена.
Асимметрия равна 0 при ν> 3, в противном случае не определена.

Примечание -
Степени свободы относятся к количеству независимых наблюдений в наборе данных. При оценке среднего балла или доли из одной выборки количество независимых наблюдений равно размеру выборки минус один.
Следовательно, распределение t-статистики из выборок размером 10 будет описываться при распределении, имеющем 10 - 1 или 9 степеней свободы. Точно так же t-распределение, имеющее 15 степеней свободы, будет использоваться с выборкой размером 16.

Таблица t-распределения:
Таблица t-распределения дает t-значение для разного уровня значимости и разных степеней свободы. Рассчитанное значение t будет сравниваться с табличным значением t. Например, если кто-то выполняет t-критерий студента и для этой успеваемости он взял 5% -ный уровень значимости, и он получил или вычислил t-значение, и он взял свое табличное t-значение, и если вычисленное t-значение больше, чем табличное значение t, в этом случае будет сказано, что существует значительная разница между средним значением генеральной совокупности и средними значениями выборки на уровне значимости 5%, и если наоборот, то в этом случае будет сказано, что нет значительная разница между средним значением генеральной совокупности и средним значением выборки на уровне значимости 5%. Вот ссылка на таблицу t-распределения: http://www.ttable.org/

Наука о данных

Распределение Стьюдента в статистике

f(t) = c(1+(t2/ν))(-ν+1) / 2

РЕКОМЕНДУЕМЫЕ СТАТЬИ

f(t) = c(1+(t²/ν))^{(-ν+1) / 2}