Схема звезды в моделировании хранилища данных

Опубликовано: 9 Июля, 2021

Предварительное условие - Введение в большие данные, преимущества больших данных
Схема «звезда» является основной схемой среди схем киоска данных и является самой простой. Эта схема широко используется для разработки или создания хранилища данных и размерных витрин данных. Он включает в себя одну или несколько таблиц фактов, индексирующих любое количество таблиц измерений. Схема "звезда" является необходимым случаем схемы "снежинка". Он также эффективен для обработки базовых запросов.

Он называется звездой, поскольку его физическая модель напоминает форму звезды, имеющую таблицу фактов в центре и таблицы размеров на периферии, представляющие точки звезды. Ниже приведен пример, демонстрирующий схему звезды:

В приведенной выше демонстрации SALES - это таблица фактов, имеющая атрибуты, например (идентификатор продукта, идентификатор заказа, идентификатор клиента, идентификатор работодателя, итого, количество, скидка), которая ссылается на таблицы измерений. Таблица измерения сотрудников содержит атрибуты: Emp ID, Emp Name, Title, Department и Region. Таблица параметров продукта содержит атрибуты: ID продукта, Название продукта, Категория продукта, Цена за единицу. Таблица измерения клиентов содержит атрибуты: идентификатор клиента, имя клиента, адрес, город, почтовый индекс. Таблица измерения времени содержит атрибуты: ID заказа, Дата заказа, Год, Квартал, Месяц.

Модель звездной схемы -
В схеме «звезда» данные бизнес-процесса, содержащие количественные данные о бизнесе, распределены в таблицах фактов и измерениях, которые являются описательными характеристиками, связанными с данными фактов. Цена продажи, количество продаж, расстояние, скорость, вес и вес - вот несколько примеров фактических данных в звездообразной схеме.
Часто схема "звезда", имеющая несколько измерений, называется схемой многоножки. Легко обрабатывать звездообразную схему, размерность которой имеет несколько атрибутов.

Преимущества звездообразной схемы -

  1. Более простые запросы:
    Логика соединения звездообразной схемы довольно удобна по сравнению с другой логикой соединения, которая необходима для извлечения данных из схемы транзакций, которая в высокой степени нормализована.

  2. Упрощенная логика бизнес-отчетности:
    По сравнению с транзакционной схемой, которая в высшей степени нормализована, звездообразная схема упрощает общую логику бизнес-отчетности, такую как отчетность по состоянию на дату и период за период.

  3. Кубики для кормления:
    Схема «звезда» широко используется всеми системами OLAP для эффективного проектирования кубов OLAP. Фактически, основные системы OLAP предоставляют режим работы ROLAP, который может использовать звездообразную схему в качестве источника без проектирования структуры куба.

Недостатки звездообразной схемы -

  1. Целостность данных не обеспечивается должным образом из-за сильно ненормализованного состояния схемы.
  2. Не гибкий с точки зрения аналитических потребностей в качестве нормализованной модели данных.
  3. Звездообразные схемы не укрепляют отношения «многие ко многим» внутри бизнес-сущностей - по крайней мере, не часто.