ML | Локально взвешенная линейная регрессия

Опубликовано: 25 Июля, 2021

Предпосылка: ML | Линейная регрессия

Линейная регрессия - это контролируемый алгоритм обучения, используемый для вычисления линейных отношений между входом (X) и выходом (Y).

Этапы обычной линейной регрессии:

Training phase: Compute to minimize the cost.

Predict output: for given query point ,


Как видно из изображения ниже, этот алгоритм нельзя использовать для прогнозирования, когда существует нелинейная связь между X и Y. В таких случаях используется локально взвешенная линейная регрессия.

Локально взвешенная линейная регрессия:

Локально взвешенная линейная регрессия - это непараметрический алгоритм, то есть модель не изучает фиксированный набор параметров, как это делается в обычной линейной регрессии. Скорее параметры вычисляются индивидуально для каждой точки запроса . При вычислении , большее «предпочтение» отдается точкам обучающей выборки, лежащим в окрестности чем точки, лежащие далеко от .

Модифицированная функция стоимости:

где, неотрицательный «вес», связанный с точкой тренировки .
Для лежит ближе к точке запроса , значение большой, а для лежит далеко от значение маленький.

Типичный выбор является:
где, называется параметром пропускной способности и управляет скоростью, с которой падает с расстоянием от

Очевидно, что если маленький близко к 1 и если большой близко к 0.

Таким образом, установочные точки обучения, расположенные ближе к точке запроса вносить больший вклад в стоимость чем точки, лежащие далеко от .

Например -

Рассмотрим точку запроса = 5.0 и пусть а также - две точки в обучающей выборке, такие что = 4.9 и = 3,0.
Используя формулу с участием = 0,5:



Таким образом, веса падают экспоненциально по мере увеличения расстояния между а также увеличивается, как и вклад ошибки в прогноз для к стоимости.

Следовательно, при вычислении , мы уделяем больше внимания сокращению для точек, расположенных ближе к точке запроса (имеющих большее значение ).

Шаги, связанные с локально взвешенной линейной регрессией:

Compute to minimize the cost.
Predict Output: for given query point ,

Что следует помнить:

  • Локально взвешенная линейная регрессия - это алгоритм обучения с учителем.
  • Это непараметрический алгоритм.
  • Не существует фазы обучения. Вся работа выполняется на этапе тестирования / при составлении прогнозов.