Как рассчитать двухрядную корреляцию в Excel?

Опубликовано: 24 Февраля, 2023

Коэффициент точечно-бисериальной корреляции — это показатель корреляции, который измеряет степень взаимосвязи между непрерывной и двоичной переменной. Связь между двоичной переменной x и непрерывной переменной y измеряется с помощью точечно-бисериальной корреляции. Бинарные переменные широко используются для описания наличия определенного признака или принадлежности к группе наблюдаемых экземпляров. Создайте двоичную переменную из данных порядкового или непрерывного уровня, поскольку данные порядкового и непрерывного уровня содержат больше информации о дисперсии, чем номинальные данные, и, таким образом, повышают надежность любого корреляционного исследования.

Коэффициент точечно-бисериальной корреляции

Коэффициент двухрядной точечной корреляции, как и коэффициент корреляции Пирсона, имеет значение от -1 до 1, где:

  • Полностью отрицательная корреляция между двумя переменными представлена числом -1.
  • 0 означает, что между двумя переменными нет связи.
  • Коэффициент корреляции, равный 1, означает полностью положительную связь между двумя переменными.

Это продемонстрирует, как вычислить двухрядную корреляцию между двумя переменными. Он принимает только два диапазона значений в качестве аргументов.

= CORREL ( Variable1, Variable2 )

Переменные 1 и 2 — это две переменные, для которых вы хотите вычислить двухрядную корреляцию.

Пример 1. Предположим, что у нас есть двоичная переменная x и непрерывная переменная y:

Мы можем легко использовать метод =CORREL() для определения точечно-бисериальной корреляции между x и y.

Точечная бисериальная корреляция между x и y составляет 0,242811. Хотя это число положительное, оно подразумевает, что когда переменная x установлена на «1», переменная y имеет тенденцию принимать большие значения, чем когда переменная x установлена на «0». Это просто демонстрируется путем вычисления среднего значения y, когда x равно 0 и когда x равно 1.

Среднее значение y для x = 0 составляет 14,6. Среднее значение y для x = 1 составляет 17,75. Это подтверждает, что двухрядная корреляция двух переменных должна быть положительной.

Пример 2. Предположим, что у нас есть непрерывная переменная y и двоичная переменная x:

Мы можем просто найти точечно-бисериальную корреляцию между x и y, используя метод =CORREL():

Точечная бисериальная корреляция между x и y составляет 0,38833. Хотя это число положительное, это означает, что когда переменная x установлена на «1», переменная y имеет тенденцию принимать большие значения, чем когда переменная x установлена на «0». Просто вычислите среднее значение y, когда x равно 0 и когда x равно 1, чтобы проиллюстрировать это:

Для x = 0 среднее значение y равно 23,5. Для x = 1 среднее значение y равно 35,983. Это показывает, что точечная бисериальная корреляция между двумя переменными должна быть положительной.