Архитектура HBase

Опубликовано: 30 Ноября, 2021

Предварительные требования - Введение в Hadoop, Apache HBase
Архитектура HBase состоит из 3 основных компонентов: HMaster, Region Server, Zookeeper.


Рисунок - Архитектура HBase

Все 3 компонента описаны ниже:

  1. HMaster -
    Реализация главного сервера в HBase - это HMaster. Это процесс, в котором регионы назначаются серверу регионов, а также операциям DDL (создание, удаление таблицы). Он отслеживает все экземпляры Region Server, присутствующие в кластере. В распределенной среде Мастер запускает несколько фоновых потоков. HMaster имеет множество функций, таких как управление балансировкой нагрузки, переключение при отказе и т. Д.

  2. Сервер региона -
    Таблицы HBase разделены по горизонтали диапазоном ключей строк на регионы. Регионы являются основными строительными элементами кластера HBase, который состоит из распределения таблиц и состоит из семейств столбцов. Сервер региона работает на HDFS DataNode, который присутствует в кластере Hadoop. Регионы сервера регионов отвечают за несколько вещей, таких как обработка, управление, выполнение, а также чтение и запись операций HBase в этом наборе регионов. Размер региона по умолчанию - 256 МБ.

  3. Работник зоопарка -
    Это как координатор в HBase. Он предоставляет такие услуги, как сохранение информации о конфигурации, именование, обеспечение распределенной синхронизации, уведомление об отказе сервера и т. Д. Клиенты общаются с региональными серверами через zookeeper.

Преимущества HBase -

  1. Может хранить большие наборы данных
  2. База данных может быть общедоступной
  3. Экономия от гигабайт до петабайт
  4. Высокая доступность за счет аварийного переключения и репликации

Недостатки HBase -

  1. Нет поддержки структуры SQL
  2. Нет поддержки транзакции
  3. Сортировано только по ключу
  4. Проблемы с памятью в кластере

Сравнение HBase и HDFS:

  • HBase обеспечивает доступ с низкой задержкой, в то время как HDFS обеспечивает операции с высокой задержкой.
  • HBase поддерживает произвольное чтение и запись, а HDFS поддерживает однократную запись и многократную запись.
  • Доступ к HBase осуществляется через команды оболочки, Java API, REST, Avro или Thrift API, а доступ к HDFS осуществляется через задания MapReduce.

Примечание. HBase широко используется для онлайн-аналитических операций, например, в банковских приложениях, таких как обновление данных в реальном времени в банкоматах, можно использовать HBase.