ML | Классификация против регрессии
Предпосылка: классификация и регрессия
Классификация и регрессия - две основные проблемы прогнозирования, которые обычно решаются с помощью интеллектуального анализа данных и машинного обучения.
Классификация - это процесс поиска или обнаружения модели или функции, которая помогает разделить данные на несколько категориальных классов, то есть дискретных значений. При классификации данные распределяются по категориям по разным меткам в соответствии с некоторыми параметрами, указанными во входных данных, а затем для данных прогнозируются метки.
Производная функция отображения может быть продемонстрирована в форме правил «ЕСЛИ-ТО». Процесс классификации имеет дело с проблемами, когда данные могут быть разделены на двоичные или несколько дискретных меток.
Возьмем пример, предположим, что мы хотим спрогнозировать возможность выигрыша матча Командой А на основе некоторых параметров, записанных ранее. Тогда было бы два ярлыка Да и Нет.
Рис. Бинарная классификация и мультиклассовая классификация
Регрессия - это процесс поиска модели или функции для разделения данных на непрерывные реальные значения вместо использования классов или дискретных значений. Он также может идентифицировать движение распределения в зависимости от исторических данных. Поскольку модель прогнозирования регрессии предсказывает количество, следовательно, навык модели должен быть сообщен как ошибка в этих прогнозах.
Давайте возьмем аналогичный пример и в регрессии, где мы находим возможность дождя в некоторых конкретных регионах с помощью некоторых параметров, записанных ранее. Тогда есть вероятность, связанная с дождем.
Рис. Регрессия дня в зависимости от количества осадков (в мм)
Сравнение классификации и регрессии:
Параметр | КЛАССИФИКАЦИЯ | РЕГРЕССИЯ |
---|---|---|
Базовый | Функция сопоставления используется для сопоставления значений с предопределенными классами. | Функция отображения используется для отображения значений в непрерывный вывод. |
Предполагает предсказание | Дискретные значения | Непрерывные значения |
Характер прогнозируемых данных | Неупорядоченный | Упорядоченный |
Методика расчета | путем измерения точности | путем измерения среднеквадратичной ошибки |
Примеры алгоритмов | Дерево решений, логистическая регрессия и т. Д. | Дерево регрессии (случайный лес), линейная регрессия и т. Д. |