Распределение Стьюдента в статистике
T-распределение Стьюдента или t-распределение - это распределение вероятностей, которое используется для расчета параметров генеральной совокупности, когда размер выборки невелик и когда дисперсия генеральной совокупности неизвестна. Теоретическая работа по t-распределению была проведена WS Gosset ; свои выводы он опубликовал под псевдонимом « Студент ». Вот почему он называется t-критерием Стьюдента .
Это выборочное распределение t-статистики. Значения t-статистики выражаются следующим образом:
t = [x̄ - μ] / [s / sqrt (n)] где, t = t оценка x̄ = выборочное среднее, μ = среднее значение по совокупности, s = стандартное отклонение выборки, n = размер выборки
Когда использовать t-распределение?
Распределение Стьюдента используется, когда
- Размер выборки должен быть 30 или меньше 30.
- Стандартное отклонение совокупности (σ) неизвестно.
- Распределение населения должно быть одномодальным и асимметричным.
Математический вывод t-распределения:
T-распределение было получено математически в предположении нормально распределенной совокупности, и формула или уравнение будут такими:
f(t) = c(1+(t2/ν))(-ν+1) / 2
where,
c = Constant required to make the area under the curve equal to unity
ν = Degrees of freedom
Таким образом, это уравнение указывает на функцию плотности вероятности (pdf) распределения t для ν степеней свободы.
Свойства t-распределения:
Приведенная выше диаграмма показывает, что синяя цветовая кривая является стандартной кривой нормального распределения или кривой распределения Z, потому что размер выборки (n) больше 30. А красная цветовая кривая является кривой t-распределения, потому что размер выборки (n) близко к 30. Точно так же кривая зеленого цвета также является кривой t-распределения, потому что размер выборки (n) меньше 30.
T-распределение обладает следующими свойствами:
- Переменная в t-распределении изменяется от -∞ до + ∞ ( -∞ <t <+ ∞ ).
- t-распределение будет симметричным, как и нормальное распределение, если степень t четна в функции плотности вероятности (pdf).
- Для больших значений ν (т.е. увеличенного размера выборки n); t-распределение стремится к стандартному нормальному распределению. Это означает, что для разных значений ν форма t-распределения также различается.
- T-распределение имеет менее пики, чем нормальное распределение в центре, и более высокое пиковое значение в хвостах. Из приведенной выше диаграммы можно заметить, что красная и зеленая кривые имеют меньше пиков в центре, но более высокие пики на хвостах, чем синяя кривая.
- Значение y (высота пика) достигает максимального значения при μ = 0, как можно видеть на приведенной выше диаграмме.
- Среднее значение распределения равно 0 для ν> 1, где ν = степени свободы, в противном случае не определено.
- Медиана и мода распределения равны 0.
- Дисперсия равна ν / ν-2 для ν> 2 и ∞ для 2 <ν ≤ 4 в противном случае не определена.
- Асимметрия равна 0 при ν> 3, в противном случае не определена.
Примечание -
Степени свободы относятся к количеству независимых наблюдений в наборе данных. При оценке среднего балла или доли из одной выборки количество независимых наблюдений равно размеру выборки минус один.
Следовательно, распределение t-статистики из выборок размером 10 будет описываться при распределении, имеющем 10 - 1 или 9 степеней свободы. Точно так же t-распределение, имеющее 15 степеней свободы, будет использоваться с выборкой размером 16.
Таблица t-распределения:
Таблица t-распределения дает t-значение для разного уровня значимости и разных степеней свободы. Рассчитанное значение t будет сравниваться с табличным значением t. Например, если кто-то выполняет t-критерий студента и для этой успеваемости он взял 5% -ный уровень значимости, и он получил или вычислил t-значение, и он взял свое табличное t-значение, и если вычисленное t-значение больше, чем табличное значение t, в этом случае будет сказано, что существует значительная разница между средним значением генеральной совокупности и средними значениями выборки на уровне значимости 5%, и если наоборот, то в этом случае будет сказано, что нет значительная разница между средним значением генеральной совокупности и средним значением выборки на уровне значимости 5%. Вот ссылка на таблицу t-распределения: http://www.ttable.org/