Общие сведения о типах атрибутов данных | Качественный и количественный
Предварительные требования: интеллектуальный анализ данных
Когда мы говорим о интеллектуальном анализе данных, мы обычно обсуждаем открытие знаний из данных. Чтобы узнать о данных, необходимо обсудить объекты данных, атрибуты данных и типы атрибутов данных. Добыча данных включает в себя знание данных, нахождение связей между данными. А для этого нам нужно обсудить объекты данных и атрибуты.
Объекты данных являются неотъемлемой частью базы данных. Объект данных представляет сущность. Объекты данных похожи на группу атрибутов сущности. Например, объект данных продаж может представлять клиентов, продажи или покупки. Когда объект данных указан в базе данных, они называются кортежами данных.
Атрибут:
Его можно рассматривать как поле данных, которое представляет характеристики или особенности объекта данных. Для клиента атрибутами объекта могут быть идентификатор клиента, адрес и т. Д. Мы можем сказать, что набор атрибутов, используемых для описания данного объекта, известен как вектор атрибутов или вектор признаков.
Тип атрибутов:
Это первый шаг предварительной обработки данных. Мы различаем разные типы атрибутов, а затем предварительно обрабатываем данные. Итак, вот описание типов атрибутов.
- Качественный (номинальный (N), порядковый (O), двоичный (B)).
- Количественный (числовой, дискретный, непрерывный)

Качественные атрибуты:
1. Номинальные атрибуты - связанные с именами: значения номинального атрибута - это названия вещей, своего рода символы. Значения номинальных атрибутов представляют некоторую категорию или состояние, поэтому номинальный атрибут также называется категориальными атрибутами, и между значениями номинального атрибута нет порядка (ранга, положения).
Пример :

2. Двоичные атрибуты: двоичные данные имеют только 2 значения / состояния. Например, да или нет, затронуты или не затронуты, истина или ложь.
- Симметричный: оба значения одинаково важны (пол).
- Асимметричный: оба значения не одинаково важны (Результат).


3. Порядковые атрибуты: Порядковые атрибуты содержат значения, которые имеют значимую последовательность или ранжирование (порядок) между ними, но величина между значениями на самом деле неизвестна, порядок значений показывает, что важно, но не указывает, насколько это важно. является.

Количественные характеристики:
1. Числовой: числовой атрибут является количественным, потому что это измеримая величина, представленная в виде целых или действительных значений. Числовые атрибуты бывают двух типов: интервал и соотношение .
- Атрибут с интервальным масштабированием имеет значения, различия которых можно интерпретировать, но числовые атрибуты не имеют правильной контрольной точки, или мы можем назвать нулевыми точками. Данные можно складывать и вычитать с интервалом, но нельзя умножать или делить. Рассмотрим пример температуры в градусах Цельсия. Если дневная температура одного дня в два раза выше, чем в другой, мы не можем сказать, что в один день в два раза жарче, чем в другой.
- Атрибут с масштабным коэффициентом - это числовой атрибут с фиксированной нулевой точкой. Если измерение масштабируется по соотношению, мы можем сказать, что значение является кратным (или соотношением) другого значения. Значения упорядочены, и мы также можем вычислить разницу между значениями, и можно указать среднее, медианное значение, режим, квантильный диапазон и сводку по пяти числам.
2. Дискретные: Дискретные данные имеют конечные значения, они могут быть числовыми, а также могут быть в категориальной форме. Эти атрибуты имеют конечный или счетно бесконечный набор значений.
Пример:

3. Непрерывный : непрерывные данные не имеют бесконечного числа состояний. Непрерывные данные относятся к типу с плавающей запятой. Может быть много значений от 2 до 3.
Пример :
