Apache HIVE - Параметры базы данных
Apache hive - это инструмент для хранения данных, созданный на основе Hadoop. Структурированные данные можно обрабатывать с помощью языка запросов Hive. В этой статье мы увидим параметры, доступные для баз данных в Hive.
База данных используется для хранения информации. Улей создаст каталог для каждой из созданных баз данных. Все таблицы, созданные внутри базы данных, будут храниться в подкаталогах каталога базы данных. Мы можем найти место на HDFS (Hadoop Distributed File System) , где каталоги для базы данных сделаны путем проверки hive.metastore.warehouse.dir свойства в /conf/hive-site.xml файла.
/ user / hive / inventory - это расположение каталога по умолчанию, заданное в свойстве hive.metastore.warehouse.dir, в котором создаются все каталоги баз данных и таблиц. Местоположение настраивается, и мы можем изменить его в соответствии с нашими требованиями. Например, если мы создали базу данных с именем Test, тогда Hive создаст каталог /user/hive/warehouse/Test.db . Давайте проведем небольшую демонстрацию этого.
Шаг 1. Запустите все демоны Hadoop.
Шаг 2: Запустите оболочку Hive.
Шаг 3: Создайте базу данных с именем Test .
Синтаксис:
СОЗДАТЬ БАЗУ ДАННЫХ <имя-базы-данных>;
Команда:
создать базу данных Test;
Шаг 4. Проверьте расположение / пользователя / улей / хранилище в HDFS, чтобы узнать, создан ли каталог базы данных. Для Hadoop 3 перейдите по адресу http: // localhost: 9870, а для Hadoop 2 перейдите по адресу http: // localhost: 50070, чтобы просмотреть узел имени. Нажмите «Утилиты» -> «Просмотрите файловую систему», затем перейдите в / пользователь / улей / хранилище .
На изображении выше мы видим, что база данных Test.db доступна.
Параметры, доступные с базой данных в Hive
1. Расположение
Параметр «Местоположение» помогает пользователю изменить местоположение по умолчанию, в котором создается каталог базы данных. Как мы знаем, каталог по умолчанию, в котором создаются базы данных, - это / user / hive / inventory. поэтому мы можем изменить этот каталог с помощью этой опции.
Давайте создадим каталог с именем hive_db в HDFS с помощью следующей команды.
hdfs dfs -mkdir / hive_db
Теперь синтаксис для использования параметра «Местоположение» с командой создания базы данных показан ниже.
СОЗДАТЬ БАЗУ ДАННЫХ <имя_базы_данных> МЕСТОПОЛОЖЕНИЕ '/ <путь-к-каталогу на жестком диске>';
Пример:
Создайте базу данных с именем Temp в каталоге / hive_db на HDFS. Здесь LOCATION переопределит местоположение по умолчанию, в котором создается каталог базы данных. Теперь таблицы, которые вы создаете для этой базы данных, будут созданы внутри / hive_db в HDFS.
СОЗДАТЬ БАЗУ ДАННЫХ Temp МЕСТО '/ hive_db';
2. КОММЕНТАРИЙ
Мы можем добавлять комментарии к созданной нами базе данных. Мы можем добавить несколько причин, по которым мы создали эту базу данных и т. Д.
Синтаксис:
СОЗДАТЬ БАЗУ ДАННЫХ <имя_базы_данных> КОММЕНТАРИЙ '<добавляемый вами комментарий>';
Пример:
СОЗДАТЬ БАЗУ ДАННЫХ ученика КОММЕНТАРИЙ «В БД хранятся данные студентов»;
3. ОПИСАТЬ
Мы можем использовать DESCRIBE для описания нашей базы данных. Он используется с базами данных, таблицами и представлениями в улье. Опция покажет расположение базы данных и другую информацию об этой базе данных.
Синтаксис:
ОПИСАТЬ БАЗУ ДАННЫХ <имя_базы данных>;
Пример:
ОПИСАТЬ БАЗУ ДАННЫХ Temp; ОПИСАТЬ БАЗУ ДАННЫХ студент;
4. С DBPROPERTIES
С помощью этой опции мы можем добавить некоторые свойства или информацию в нашу базу данных в виде пары ключ-значение. Свойства, добавленные с помощью этой опции, можно просмотреть только с помощью опции EXTENDED с командой DESCRIBE DATABASE.
Синтаксис:
СОЗДАТЬ БАЗУ ДАННЫХ <имя_базы_данных> С DBPROPERTIES ('<имя-ключа>' = '<значение>');
Пример:
СОЗДАТЬ БАЗУ ДАННЫХ сотрудника С DBPROPERTIES ('сделано' = 'GFG', 'date' = '2020-10-10', 'company' = 'GeeksForGeeks');
Теперь давайте посмотрим на эти значения с помощью базы данных Describe.
ОПИСАТЬ БАЗУ ДАННЫХ сотрудника; # не показывает свойство, добавленное с помощью WITH DBPRROPERTIES ОПИСАТЬ РАСШИРЕННУЮ БАЗУ ДАННЫХ сотрудника; # показывает свойство, добавленное с помощью WITH DBPROPERTIES
5. ИСПОЛЬЗОВАНИЕ
Команда USE используется для работы с базами данных. Поскольку доступно несколько баз данных, мы можем выбрать или выбрать базу данных для использования с командой или параметром USE.
Синтаксис:
ИСПОЛЬЗУЙТЕ <имя-базы-данных>;
Пример:
Сотрудник ЕГЭ;
6. ОТКАЗАТЬ
DROP используется для удаления существующей базы данных.
Синтаксис:
DROP DATABASE <database_name>;
Пример:
Сотрудник DROP DATABASE;
7. ПОКАЗАТЬ
SHOW используется для отображения существующего списка доступных баз данных.
Команда:
ПОКАЗАТЬ БАЗЫ ДАННЫХ;