Измеряет их категоризацию и вычисление в интеллектуальном анализе данных
Интеллектуальный анализ данных можно определить как процесс сортировки или упорядочивания больших наборов данных для выявления закономерностей и взаимосвязей. Эти шаблоны или отношения могут быть полезны при решении бизнес-задач посредством анализа данных. Различные инструменты и методы интеллектуального анализа данных помогли различным учреждениям или предприятиям прогнозировать будущие тенденции и получать от них прибыль. Интеллектуальный анализ данных считается важной частью анализа данных. Говорят, что это один из основных принципов науки о данных (наука о данных — это использование передовых методов аналитики для поиска полезной информации в заданных наборах данных). Интеллектуальный анализ данных — очень важная часть аналитических инициатив в различных организациях. Информация, сгенерированная или обработанная при этом, в основном используется в приложениях бизнес-аналитики и расширенной аналитики.
Меры интеллектуального анализа данных можно разделить на три категории: целостные, дистрибутивные и алгебраические. Упомянутая классификация или деление мер основывается на том, какой тип агрегатных функций в них используется.
Целостный:
Если нет определенного ограничения или предела объема памяти, необходимого для определения подагрегата, любая заданная агрегатная функция называется целостной. Его можно описать как алгебраическую функцию с n аргументами.
Например, median(), rank() и mode() являются целостными показателями. Если какая-либо мера использует целостную агрегатную функцию, то ее можно назвать целостной. Большинство кубических приложений, работающих с большими объемами данных, требуют быстрых вычислений дистрибутивных и алгебраических измерений.
Распределение:
Если какая-либо функция вычисляется доставленным способом, как указано, то говорят, что она является распределительной функцией. Будем считать данные независимыми на m наборов. Он должен иметь возможность использовать услуги каждого раздела, что дает m совокупных значений. Когда результат, полученный путем применения функции к n совокупным значениям, идентичен результату, полученному путем применения функции ко всему набору данных (без разделения), говорят, что функция применяется рассредоточенным образом.
Например, count() для куба данных можно рассчитать, разделив или разбив куб на группу вложенных кубов одинакового размера. Мы можем вычислить count() для каждого вложенного куба, а затем сложить их, чтобы получить общее количество. . поэтому мы можем заключить, что функция count() является сервисом распределенных агрегатов.
Мера y называется распределительной, если она может быть получена с помощью службы распределенной агрегации.
Примеры: Сумма(), Подсчет(), Минимум().
Алгебраический:
Если любую агрегированную функцию можно вычислить с помощью алгебраической службы, то она называется алгебраической. Он вычисляется как алгебраическая функция от N аргументов, где N — положительное целое число.
Мы можем рассмотреть пример функции усреднения или avg(). Функция среднего значения в основном вычисляется с помощью sum() или count() или обоих(). В этом случае и Count(), и Sum() являются распределенными агрегатными службами, но их разделение приводит к алгебраической функции. аналогично min () и max () также являются алгебраическими. Если какая-либо мера получена с использованием какой-либо алгебраической совокупной службы, ее можно назвать алгебраической функцией.
Пример: Average(), ManN(), MinN(), CenterofMass()