Что такое данные?

Опубликовано: 26 Июня, 2021

Согласно Оксфорду, «данные - это отдельные фрагменты информации, обычно отформатированные особым образом».
Данные измеряются, собираются, сообщаются и анализируются, после чего они часто визуализируются с помощью графиков, изображений или других инструментов анализа. Необработанные данные («необработанные данные») могут представлять собой набор чисел или символов до того, как они будут «очищены» и исправлены исследователями. Его необходимо исправить, чтобы мы могли удалить выбросы, ошибки инструментов или ввода данных. Обработка данных обычно происходит поэтапно, поэтому «обработанные данные» одного этапа также могут считаться «необработанными данными» последующего этапа. Полевые данные - это данные, которые собираются в неконтролируемой среде «на месте». Экспериментальные данные - это данные, полученные в результате наблюдения за научными исследованиями.

Данные могут быть получены с помощью:

  • Люди
  • Машины
  • Человеко-машинные комбайны.

Часто его можно генерировать где угодно, где создается и хранится любая информация в структурированных или неструктурированных форматах.

Почему важны данные?

  • Данные помогают принимать более правильные решения.
  • Данные помогают решать проблемы, находя причину низкой производительности.
  • Данные помогают оценить производительность.
  • Данные помогают улучшить процессы.
  • Данные помогают понять потребителей и рынок.

Типы данных:
Обычно данные можно разделить на две части:

  1. Категориальные данные:
    В категориальных данных мы видим данные, которые имеют определенную категорию, например:
    • Семейное положение
    • Политическая партия
    • Цвет глаз
  2. Числовые данные:
    Числовые данные можно разделить на две категории:
    • Дискретные данные:
      Дискретные данные содержат данные, которые имеют дискретные числовые значения, например количество дочерних элементов, дефектов в час и т. Д.
    • Непрерывные данные:
      Непрерывные данные содержат данные, которые имеют непрерывные числовые значения, например вес, напряжение и т. Д.

На продвинутом уровне мы можем разделить данные на четыре части:

  1. Номинальная шкала:
    Номинальная шкала классифицирует данные по нескольким отдельным категориям, в которых не подразумеваются критерии ранжирования. Например, пол, семейное положение.
  2. Обычная шкала:
    Порядковая шкала классифицирует данные по отдельным категориям, в которых подразумевается ранжирование. Например:
    • Звание факультета: профессор, доцент, доцент.
    • Оценка учащихся: A, B, C, DEF
  3. Шкала интервалов:
    Шкала интервалов может быть упорядоченной шкалой, в которой разница между измерениями является значимой величиной, но измерения не имеют истинной нулевой точки. Например:
    • Температура в градусах Фаренгейта и Цельсия.
    • Годы
  4. Масштаб отношения:
    Шкала отношений может быть упорядоченной шкалой, в которой разница между измерениями является значимой величиной и, следовательно, измерения имеют истинную нулевую точку. Следовательно, мы можем выполнять арифметические операции с данными реального масштаба. Например: вес, возраст, зарплата и т. Д.