Как рассчитать двухрядную корреляцию в Excel?
Коэффициент точечно-бисериальной корреляции — это показатель корреляции, который измеряет степень взаимосвязи между непрерывной и двоичной переменной. Связь между двоичной переменной x и непрерывной переменной y измеряется с помощью точечно-бисериальной корреляции. Бинарные переменные широко используются для описания наличия определенного признака или принадлежности к группе наблюдаемых экземпляров. Создайте двоичную переменную из данных порядкового или непрерывного уровня, поскольку данные порядкового и непрерывного уровня содержат больше информации о дисперсии, чем номинальные данные, и, таким образом, повышают надежность любого корреляционного исследования.
Коэффициент точечно-бисериальной корреляции
Коэффициент двухрядной точечной корреляции, как и коэффициент корреляции Пирсона, имеет значение от -1 до 1, где:
- Полностью отрицательная корреляция между двумя переменными представлена числом -1.
- 0 означает, что между двумя переменными нет связи.
- Коэффициент корреляции, равный 1, означает полностью положительную связь между двумя переменными.
Это продемонстрирует, как вычислить двухрядную корреляцию между двумя переменными. Он принимает только два диапазона значений в качестве аргументов.
= CORREL ( Variable1, Variable2 )
Переменные 1 и 2 — это две переменные, для которых вы хотите вычислить двухрядную корреляцию.
Пример 1. Предположим, что у нас есть двоичная переменная x и непрерывная переменная y:
Мы можем легко использовать метод =CORREL() для определения точечно-бисериальной корреляции между x и y.
Точечная бисериальная корреляция между x и y составляет 0,242811. Хотя это число положительное, оно подразумевает, что когда переменная x установлена на «1», переменная y имеет тенденцию принимать большие значения, чем когда переменная x установлена на «0». Это просто демонстрируется путем вычисления среднего значения y, когда x равно 0 и когда x равно 1.
Среднее значение y для x = 0 составляет 14,6. Среднее значение y для x = 1 составляет 17,75. Это подтверждает, что двухрядная корреляция двух переменных должна быть положительной.
Пример 2. Предположим, что у нас есть непрерывная переменная y и двоичная переменная x:
Мы можем просто найти точечно-бисериальную корреляцию между x и y, используя метод =CORREL():
Точечная бисериальная корреляция между x и y составляет 0,38833. Хотя это число положительное, это означает, что когда переменная x установлена на «1», переменная y имеет тенденцию принимать большие значения, чем когда переменная x установлена на «0». Просто вычислите среднее значение y, когда x равно 0 и когда x равно 1, чтобы проиллюстрировать это:
Для x = 0 среднее значение y равно 23,5. Для x = 1 среднее значение y равно 35,983. Это показывает, что точечная бисериальная корреляция между двумя переменными должна быть положительной.