Показатели разброса — диапазон, дисперсия и стандартное отклонение

Опубликовано: 8 Октября, 2022

Сбор данных и представление их в виде таблиц, графиков и других распределений очень важны для нас. Но также важно, чтобы мы получили четкое представление о том, как данные распределяются, насколько они разбросаны и каково среднее значение данных. Показателей среднего недостаточно для описания данных и их характера. Нам также необходимо измерить дисперсию данных по отношению к различной статистике данных. Например, нам нужно иметь возможность ответить на такие вопросы, как, насколько велика дисперсия среднего значения окружающих данных или его медиана. Эти значения позволяют нам лучше описать данные. Давайте посмотрим на некоторые из них,

Дисперсия, которую также называют разбросом, измеряется исходя из типа выбранной центральной тенденции и доступных нам наблюдений. Эти меры говорят нам , насколько наблюдения различаются или похожи друг на друга. Существует много способов измерения разброса данных, некоторые основные способы измерения разброса приведены ниже:

  1. Диапазон
  2. Дисперсия
  3. Стандартное отклонение

Диапазон

Диапазон данных задается как разница между максимальным и минимальным значениями наблюдений в данных. Например, предположим, что у нас есть данные о количестве покупателей, посещающих магазин за неделю.

10, 14, 8, 10, 15, 4, 7

Минимальное значение в данных = 7

Максимальное значение в данных = 15

Диапазон = Максимальное значение в данных – Минимальное значение в данных

= 15 – 7

= 8

Теперь мы можем сказать, что диапазон данных равен 8. Это дает нам представление о распространении данных, но не говорит о том, как они распределяются.

Дисперсия

Дисперсия данных определяется путем измерения расстояния наблюдаемых значений от среднего значения распределения. Здесь нас не интересует знак расстояния до точки, нас больше интересует величина. Итак, возьмем квадраты расстояния от среднего. Допустим, у нас есть х 1 , х 2 , х 3 …. x n как n наблюдений и быть средним.

Если эта сумма равна нулю, то каждый член должен быть равен нулю, что означает отсутствие рассеяния данных. Если она маленькая, то это означает, что данные сконцентрированы у среднего и наоборот при больших значениях дисперсии.

Но эта мера по-прежнему зависит от количества наблюдений в данных. То есть, если наблюдений много, это значение станет большим. Итак, мы берем среднее значение данных,

Стандартное отклонение

При расчете дисперсии обратите внимание, что единицы дисперсии и единицы наблюдения не совпадают. Итак, чтобы устранить эту проблему, мы определяем стандартное отклонение. Он обозначается как

Давайте посмотрим, как вычислить эти меры в некоторых задачах,

Примеры проблем

Вопрос 1: Узнайте диапазон следующих данных:

-4 5 -10 6 9

Решение:

For calculating the range of a data, we need to find out the maximum and the minimum of the data: 

Max = 9 

Min = -10

Range = Max – Min 

            = 9 -(-10) 

            = 19 

Вопрос 2: Найдите среднее значение и медиану тех же данных:

-4 5 -10 6 9

Решение:

Mean of the data: 

                           = 

                           = 1.2

Median is called the middle element of the data. 

Median = -10. 

Вопрос 3: Допустим, у нас есть следующие данные,

-4 -2 0 -2 6 4 6 0 -6 4

Вычислите диапазон, дисперсию и стандартное отклонение данных.

Решение:

Range

We need to find out the minimum and the maximum values of the data distribution. 

Min Value = -6 

Max Value = +6 

Range = Max Value – Min Value 

            = 6 – (-6) 

            = 12 

Variance

To find the variance, we first need to find the mean, 

Mean = 

          = 

          = 0.6

We know the formula for Variance, 

Variance = 

                = 

                = 

                = 17.82 

Standard Deviation

⇒ 

⇒ 

Вопрос 4: Допустим, у нас есть следующие данные,

-3 -3 -3 -3 0 3 3 3 3

Вычислите диапазон, дисперсию и стандартное отклонение данных.

Решение:

Range

We need to find out the minimum and the maximum values of the data distribution. 

Min Value = -3 

Max Value = +3 

Range = Max Value – Min Value 

            = 3 – (-3) 

            = 6 

Variance

To find the variance, we first need to find the mean, 

Mean = 

          = 0

We know the formula for Variance, 

Variance = 

                = 

                = 

                = 9

Standard Deviation

⇒ 

⇒ 

Вопрос 5: Допустим, у нас есть следующие данные о количестве телевизоров, проданных магазином бытовой электроники за неделю:

Понедельник 4
Вторник 5
Среда 3
Четверг 4
Пятница 5
Суббота 5
Воскресенье 3

Вычислите диапазон, дисперсию и стандартное отклонение данных.

Решение:

Range

We need to find out the minimum and the maximum values of the data distribution. 

Min Value = 3 

Max Value = +5 

Range = Max Value – Min Value 

            = 5 – (3) 

            = 2 

Variance

To find the variance, we first need to find the mean, 

Mean = 

          = 

          = 2.9

We know the formula for Variance, 

Variance = 

                = 

                = 0.809

Standard Deviation

⇒ 

⇒ 

РЕКОМЕНДУЕМЫЕ СТАТЬИ