ML | Классификация против регрессии

Опубликовано: 25 Июля, 2021

Предпосылка: классификация и регрессия

Классификация и регрессия - две основные проблемы прогнозирования, которые обычно решаются с помощью интеллектуального анализа данных и машинного обучения.

Классификация - это процесс поиска или обнаружения модели или функции, которая помогает разделить данные на несколько категориальных классов, то есть дискретных значений. При классификации данные распределяются по категориям по разным меткам в соответствии с некоторыми параметрами, указанными во входных данных, а затем для данных прогнозируются метки.
Производная функция отображения может быть продемонстрирована в форме правил «ЕСЛИ-ТО». Процесс классификации имеет дело с проблемами, когда данные могут быть разделены на двоичные или несколько дискретных меток.

Возьмем пример, предположим, что мы хотим спрогнозировать возможность выигрыша матча Командой А на основе некоторых параметров, записанных ранее. Тогда было бы два ярлыка Да и Нет.

Рис. Бинарная классификация и мультиклассовая классификация

Регрессия - это процесс поиска модели или функции для разделения данных на непрерывные реальные значения вместо использования классов или дискретных значений. Он также может идентифицировать движение распределения в зависимости от исторических данных. Поскольку модель прогнозирования регрессии предсказывает количество, следовательно, навык модели должен быть сообщен как ошибка в этих прогнозах.
Давайте возьмем аналогичный пример и в регрессии, где мы находим возможность дождя в некоторых конкретных регионах с помощью некоторых параметров, записанных ранее. Тогда есть вероятность, связанная с дождем.

Рис. Регрессия дня в зависимости от количества осадков (в мм)

Сравнение классификации и регрессии:

Параметр КЛАССИФИКАЦИЯ РЕГРЕССИЯ
Базовый Функция сопоставления используется для сопоставления значений с предопределенными классами. Функция отображения используется для отображения значений в непрерывный вывод.
Предполагает предсказание Дискретные значения Непрерывные значения
Характер прогнозируемых данных Неупорядоченный Упорядоченный
Методика расчета путем измерения точности путем измерения среднеквадратичной ошибки
Примеры алгоритмов Дерево решений, логистическая регрессия и т. Д. Дерево регрессии (случайный лес), линейная регрессия и т. Д.