Ассоциативная классификация в интеллектуальном анализе данных

Опубликовано: 26 Сентября, 2022

Интеллектуальный анализ данных — это процесс обнаружения и извлечения скрытых шаблонов из различных типов данных, чтобы помочь лицам, принимающим решения, принимать решения. Ассоциативная классификация — это распространенный метод обучения классификации в интеллектуальном анализе данных, который применяет методы обнаружения правил ассоциации и классификацию для создания моделей классификации.

Изучение правила ассоциации в интеллектуальном анализе данных:

Изучение ассоциативных правил — это метод машинного обучения для обнаружения интересных взаимосвязей между переменными в больших базах данных. Он предназначен для обнаружения строгих правил в базе данных на основе некоторых интересных показателей. Для любой транзакции с несколькими элементами правила ассоциации направлены на получение правил, определяющих, как или почему связаны определенные элементы.

Правила ассоциации создаются путем поиска информации об общих шаблонах «если-то» и использования конкретных критериев с поддержкой и доверием для определения ключевых отношений. Они помогают показать частоту элемента в заданных данных, поскольку достоверность определяется количеством раз, когда утверждение «если-то» оказывается истинным. Однако для сравнения ожидаемой и фактической достоверности часто используется третий критерий, называемый подъемной силой. Подъем показывает, сколько раз утверждение «если-то» было предсказано как истинное. Создайте правила ассоциации для вычисления наборов элементов на основе данных, созданных двумя или более элементами. Правила ассоциации обычно состоят из правил, которые хорошо представлены данными.

Существуют различные типы методов интеллектуального анализа данных, которые можно использовать для получения конкретного анализа и результатов, таких как классификационный анализ, кластерный анализ и многомерный анализ. Правила ассоциации в основном используются для анализа и прогнозирования поведения клиентов.

  • В классификационном анализе он в основном используется для вопросов, принятия решений и прогнозирования поведения.
  • В кластерном анализе он в основном используется, когда не делается никаких предположений о возможных отношениях в данных.
  • В регрессионном анализе он используется, когда мы хотим предсказать бесконечно зависимое значение набора независимых переменных.

Ассоциативная классификация в интеллектуальном анализе данных:

Бинг Лю и др. был первым, кто предложил ассоциативную классификацию, в которой он определил модель, правило которой гласит: «правая часть ограничена атрибутом класса классификации». Ассоциативный классификатор — это контролируемая модель обучения, в которой используется ассоциация. правила для присвоения целевого значения.

Модель, созданная классификатором ассоциации и используемая для маркировки новых записей, состоит из правил ассоциации, которые создают метки классов. Следовательно, их также можно рассматривать как список предложений «если-то»: если запись соответствует определенным критериям (указанным в левой части правила, также известным как антецеденты), она помечается (или оценивается) в соответствии с категория правила справа. Большинство ассоциативных классификаторов последовательно считывают список правил и применяют первое подходящее правило для пометки новых записей. Правила классификатора ассоциации наследуют некоторые метрики от правил ассоциации, такие как поддержка или уверенность, которые можно использовать для ранжирования или фильтрации правил в модели и оценки их качества.

Типы ассоциативной классификации:

Существуют различные типы методов ассоциативной классификации, некоторые из них приведены ниже.

1. CBA (классификация на основе ассоциаций): для классификации данных используются методы правил ассоциации, которые оказываются более точными, чем традиционные методы классификации. Он должен столкнуться с чувствительностью минимального порога поддержки. Когда указан более низкий минимальный порог поддержки, генерируется большое количество правил.

2. CMAR (классификация на основе правил множественных ассоциаций): используется эффективное дерево FP, которое потребляет меньше памяти и места по сравнению с классификацией на основе ассоциаций. FP-дерево не всегда помещается в основную память, особенно при большом количестве атрибутов.

3. CPAR (классификация, основанная на правилах прогнозирующей ассоциации): классификация, основанная на правилах прогнозирующей ассоциации, сочетает в себе преимущества классификации ассоциации и традиционной классификации на основе правил. Классификация, основанная на правилах прогнозирующей ассоциации, использует жадный алгоритм для создания правил непосредственно из обучающих данных. Кроме того, классификация, основанная на правилах прогнозирующей ассоциации, генерирует и проверяет больше правил, чем традиционные классификаторы на основе правил, чтобы не пропустить важные правила.