Понимание проверки гипотез

Опубликовано: 23 Июля, 2021

Гипотеза - это утверждение о данной проблеме. Проверка гипотез - это статистический метод, который используется для принятия статистического решения с использованием экспериментальных данных. Проверка гипотез - это в основном предположение, которое мы делаем о параметре совокупности. Он оценивает два взаимоисключающих утверждения о генеральной совокупности, чтобы определить, какое утверждение лучше всего подтверждается выборкой данных.
Пример:
Вы говорите, что среднему ученику в классе 30 или мальчик выше девочек. Все это примеры, в которых мы предполагаем или нуждаемся в каком-то статистическом способе доказать это. Нам нужно какое-то математическое заключение, что бы мы ни предполагали, верно.

Необходимость проверки гипотез
Проверка гипотез - важная процедура в статистике. Проверка гипотез оценивает два взаимоисключающих утверждения совокупности, чтобы определить, какое из утверждений наиболее подтверждается выборочными данными. Когда мы говорим, что результаты статистически значимы, это происходит благодаря проверке гипотез.

Параметры проверки гипотез

  • Нулевая гипотеза (H0): В статистике нулевая гипотеза - это общее данное утверждение или позиция по умолчанию, что нет никакой связи между двумя измеренными случаями или никакой связи между группами.
    Другими словами, это базовое предположение или основанное на знании проблемы.
    Пример: производство компании = 50 единиц в день и т. Д.
  • Альтернативная гипотеза (H1): Альтернативная гипотеза - это гипотеза, используемая при проверке гипотез, которая противоречит нулевой гипотезе.
    Пример: производство компании не равно 50 единицам в день и т. Д.
  • Уровень значимости
    Это относится к степени значимости, в которой мы принимаем или отвергаем нулевую гипотезу. 100% точность невозможна для принятия гипотезы, поэтому мы выбираем уровень значимости, который обычно составляет 5%. Обычно это обозначается и, как правило, это 0,05 или 5%, что означает, что ваш результат должен быть уверен на 95%, чтобы дать аналогичный результат в каждом образце.
  • P-значение
    Значение P или рассчитанная вероятность - это вероятность обнаружения наблюдаемых / экстремальных результатов, когда нулевая гипотеза (H0) исследуемой проблемы верна. Если ваше значение P меньше, чем выбранный уровень значимости, вы отклоняете нулевую гипотезу, т.е. принимаете, что ваша выборка утверждает, что поддерживает альтернативную гипотезу.

Пример :
Учитывая монету, и неизвестно, справедливо это или сложно, поэтому давайте решим нулевую и альтернативную гипотезу.

  • Нулевая гипотеза (H0): монета - честная монета.
  • Альтернативная гипотеза (H1): монета - сложная монета.
  • знак равно

    Теперь давайте подбросим монету и вычислим p-value (значение вероятности).

  • Подбросьте монету в первый раз и предположите, что результат - голова - P-value = (поскольку голова и хвост имеют равную вероятность)
  • Подбросьте монету второй раз и предположите, что результат снова - голова, теперь p-value =

и аналогично, мы бросаем 6 раз подряд и получили результат как все решки, теперь значение P =
Но мы устанавливаем наш уровень значимости как уровень ошибок мы допускаем, и здесь мы видим, что мы вышли за пределы этого уровня, т.е. наша нулевая гипотеза не выполняется, поэтому нам нужно отклонить и предположить, что эта монета является сложной монетой, что на самом деле потому, что она дает нам 6 последовательных орлов.

Ошибка при проверке гипотез

  • Ошибка типа I. Когда мы отвергаем нулевую гипотезу, хотя эта гипотеза верна. Ошибка типа I обозначается буквой альфа.
  • Ошибки типа II: когда мы принимаем нулевую гипотезу, но она ложна. Ошибки типа II обозначаются бета-версией.