Что такое структурированные данные?
Структурированные данные - это данные, которые соответствуют модели данных, имеют четко определенную структуру, следуют последовательному порядку и могут быть легко доступны и использованы человеком или компьютерной программой.
Структурированные данные обычно хранятся в четко определенных схемах, таких как базы данных. Обычно это таблица с столбцами и строками, которые четко определяют его атрибуты.
SQL (язык структурированных запросов) часто используется для управления структурированными данными, хранящимися в базах данных.
Характеристики структурированных данных:
- Данные соответствуют модели данных и имеют легко идентифицируемую структуру.
- Данные хранятся в виде строк и столбцов
Пример: база данных - Данные хорошо организованы, поэтому определение, формат и значение данных четко известны.
- Данные находятся в фиксированных полях в записи или файле.
- Подобные сущности группируются вместе, образуя отношения или классы.
- Сущности в одной группе имеют одинаковые атрибуты
- Легкий доступ и запрос, поэтому данные могут быть легко использованы другими программами
- Элементы данных адресуемы, поэтому их можно эффективно анализировать и обрабатывать.
Источники структурированных данных:
- Базы данных SQL
- Таблицы, такие как Excel
- OLTP-системы
- Онлайн-формы
- Датчики, такие как метки GPS или RFID
- Журналы сети и веб-сервера
- Медицинское оборудование
Преимущества структурированных данных:
- Структурированные данные имеют четко определенную структуру, которая упрощает хранение и доступ к данным.
- Данные можно индексировать на основе текстовой строки, а также атрибутов. Это упрощает поисковую операцию.
- Интеллектуальный анализ данных прост, т.е. знания могут быть легко извлечены из данных
- Такие операции, как обновление и удаление, просты благодаря хорошо структурированной форме данных.
- Операции бизнес-аналитики, такие как хранение данных, могут быть легко выполнены
- Легко масштабируется в случае увеличения объема данных
- Обеспечить безопасность данных просто
Примечание. На структурированные данные приходится только около 20% данных, но из-за их высокой степени организации и производительности они составляют основу больших данных.
Чтобы прочитать различия между структурированными, полуструктурированными и неструктурированными данными, обратитесь к следующей статье -
- Разница между структурированными, полуструктурированными и неструктурированными данными