Apache HIVE - Параметры базы данных

Опубликовано: 18 Февраля, 2022

Apache hive - это инструмент для хранения данных, созданный на основе Hadoop. Структурированные данные можно обрабатывать с помощью языка запросов Hive. В этой статье мы увидим параметры, доступные для баз данных в Hive.

База данных используется для хранения информации. Улей создаст каталог для каждой из созданных баз данных. Все таблицы, созданные внутри базы данных, будут храниться в подкаталогах каталога базы данных. Мы можем найти место на HDFS (Hadoop Distributed File System) , где каталоги для базы данных сделаны путем проверки hive.metastore.warehouse.dir свойства в /conf/hive-site.xml файла.

/ user / hive / inventory - это расположение каталога по умолчанию, заданное в свойстве hive.metastore.warehouse.dir, в котором создаются все каталоги баз данных и таблиц. Местоположение настраивается, и мы можем изменить его в соответствии с нашими требованиями. Например, если мы создали базу данных с именем Test, тогда Hive создаст каталог /user/hive/warehouse/Test.db . Давайте проведем небольшую демонстрацию этого.

Шаг 1. Запустите все демоны Hadoop.

Шаг 2: Запустите оболочку Hive.

Шаг 3: Создайте базу данных с именем Test .

Синтаксис:

 СОЗДАТЬ БАЗУ ДАННЫХ <имя-базы-данных>;

Команда:

 создать базу данных Test;

Шаг 4. Проверьте расположение / пользователя / улей / хранилище в HDFS, чтобы узнать, создан ли каталог базы данных. Для Hadoop 3 перейдите по адресу http: // localhost: 9870, а для Hadoop 2 перейдите по адресу http: // localhost: 50070, чтобы просмотреть узел имени. Нажмите «Утилиты» -> «Просмотрите файловую систему», затем перейдите в / пользователь / улей / хранилище .

На изображении выше мы видим, что база данных Test.db доступна.

Параметры, доступные с базой данных в Hive

1. Расположение

Параметр «Местоположение» помогает пользователю изменить местоположение по умолчанию, в котором создается каталог базы данных. Как мы знаем, каталог по умолчанию, в котором создаются базы данных, - это / user / hive / inventory. поэтому мы можем изменить этот каталог с помощью этой опции.

Давайте создадим каталог с именем hive_db в HDFS с помощью следующей команды.

 hdfs dfs -mkdir / hive_db

Теперь синтаксис для использования параметра «Местоположение» с командой создания базы данных показан ниже.

 СОЗДАТЬ БАЗУ ДАННЫХ <имя_базы_данных>
МЕСТОПОЛОЖЕНИЕ '/ <путь-к-каталогу на жестком диске>';

Пример:

Создайте базу данных с именем Temp в каталоге / hive_db на HDFS. Здесь LOCATION переопределит местоположение по умолчанию, в котором создается каталог базы данных. Теперь таблицы, которые вы создаете для этой базы данных, будут созданы внутри / hive_db в HDFS.

 СОЗДАТЬ БАЗУ ДАННЫХ Temp
МЕСТО '/ hive_db';

2. КОММЕНТАРИЙ

Мы можем добавлять комментарии к созданной нами базе данных. Мы можем добавить несколько причин, по которым мы создали эту базу данных и т. Д.

Синтаксис:

 СОЗДАТЬ БАЗУ ДАННЫХ <имя_базы_данных>
КОММЕНТАРИЙ '<добавляемый вами комментарий>';

Пример:

 СОЗДАТЬ БАЗУ ДАННЫХ ученика
КОММЕНТАРИЙ «В БД хранятся данные студентов»;

3. ОПИСАТЬ

Мы можем использовать DESCRIBE для описания нашей базы данных. Он используется с базами данных, таблицами и представлениями в улье. Опция покажет расположение базы данных и другую информацию об этой базе данных.

Синтаксис:

 ОПИСАТЬ БАЗУ ДАННЫХ <имя_базы данных>;

Пример:

 ОПИСАТЬ БАЗУ ДАННЫХ Temp;

ОПИСАТЬ БАЗУ ДАННЫХ студент;

4. С DBPROPERTIES

С помощью этой опции мы можем добавить некоторые свойства или информацию в нашу базу данных в виде пары ключ-значение. Свойства, добавленные с помощью этой опции, можно просмотреть только с помощью опции EXTENDED с командой DESCRIBE DATABASE.

Синтаксис:

 СОЗДАТЬ БАЗУ ДАННЫХ <имя_базы_данных>
С DBPROPERTIES ('<имя-ключа>' = '<значение>');

Пример:

 СОЗДАТЬ БАЗУ ДАННЫХ сотрудника
С DBPROPERTIES ('сделано' = 'GFG', 'date' = '2020-10-10', 'company' = 'GeeksForGeeks'); 

Теперь давайте посмотрим на эти значения с помощью базы данных Describe.

 ОПИСАТЬ БАЗУ ДАННЫХ сотрудника; # не показывает свойство, добавленное с помощью WITH DBPRROPERTIES

ОПИСАТЬ РАСШИРЕННУЮ БАЗУ ДАННЫХ сотрудника; # показывает свойство, добавленное с помощью WITH DBPROPERTIES 

5. ИСПОЛЬЗОВАНИЕ

Команда USE используется для работы с базами данных. Поскольку доступно несколько баз данных, мы можем выбрать или выбрать базу данных для использования с командой или параметром USE.

Синтаксис:

 ИСПОЛЬЗУЙТЕ <имя-базы-данных>;

Пример:

 Сотрудник ЕГЭ;

6. ОТКАЗАТЬ

DROP используется для удаления существующей базы данных.

Синтаксис:

 DROP DATABASE <database_name>;

Пример:

 Сотрудник DROP DATABASE;

7. ПОКАЗАТЬ

SHOW используется для отображения существующего списка доступных баз данных.

Команда:

 ПОКАЗАТЬ БАЗЫ ДАННЫХ;