Архитектура HBase
Опубликовано: 30 Ноября, 2021
Предварительные требования - Введение в Hadoop, Apache HBase
Архитектура HBase состоит из 3 основных компонентов: HMaster, Region Server, Zookeeper.
Все 3 компонента описаны ниже:
- HMaster -
Реализация главного сервера в HBase - это HMaster. Это процесс, в котором регионы назначаются серверу регионов, а также операциям DDL (создание, удаление таблицы). Он отслеживает все экземпляры Region Server, присутствующие в кластере. В распределенной среде Мастер запускает несколько фоновых потоков. HMaster имеет множество функций, таких как управление балансировкой нагрузки, переключение при отказе и т. Д. - Сервер региона -
Таблицы HBase разделены по горизонтали диапазоном ключей строк на регионы. Регионы являются основными строительными элементами кластера HBase, который состоит из распределения таблиц и состоит из семейств столбцов. Сервер региона работает на HDFS DataNode, который присутствует в кластере Hadoop. Регионы сервера регионов отвечают за несколько вещей, таких как обработка, управление, выполнение, а также чтение и запись операций HBase в этом наборе регионов. Размер региона по умолчанию - 256 МБ. - Работник зоопарка -
Это как координатор в HBase. Он предоставляет такие услуги, как сохранение информации о конфигурации, именование, обеспечение распределенной синхронизации, уведомление об отказе сервера и т. Д. Клиенты общаются с региональными серверами через zookeeper.
Преимущества HBase -
- Может хранить большие наборы данных
- База данных может быть общедоступной
- Экономия от гигабайт до петабайт
- Высокая доступность за счет аварийного переключения и репликации
Недостатки HBase -
- Нет поддержки структуры SQL
- Нет поддержки транзакции
- Сортировано только по ключу
- Проблемы с памятью в кластере
Сравнение HBase и HDFS:
- HBase обеспечивает доступ с низкой задержкой, в то время как HDFS обеспечивает операции с высокой задержкой.
- HBase поддерживает произвольное чтение и запись, а HDFS поддерживает однократную запись и многократную запись.
- Доступ к HBase осуществляется через команды оболочки, Java API, REST, Avro или Thrift API, а доступ к HDFS осуществляется через задания MapReduce.
Примечание. HBase широко используется для онлайн-аналитических операций, например, в банковских приложениях, таких как обновление данных в реальном времени в банкоматах, можно использовать HBase.