Операции с базами данных в HIVE с использованием CLOUDERA - VMWARE Work Station
Мы собираемся создать базу данных и создать таблицу в нашей базе данных. И расскажет об операциях с базами данных в HIVE с использованием CLOUDERA - VMWARE Work Station. Обсудим по порядку.
Вступление:
- Hive - это инструмент ETL, который обеспечивает SQL-подобный интерфейс между пользователем и распределенной файловой системой Hadoop, которая интегрирует Hadoop.
- Он построен на основе Hadoop.
- Он облегчает чтение, запись и обработку широких наборов данных, которые хранятся в распределенном хранилище и запрашиваются с помощью синтаксиса языка запросов структуры (SQL).
Требования:
- Необходимо установить Cloudera - vmware workstation.
- Ссылка для скачивания для windows - https://www.cloudera.com/downloads/cdh.html
Клодера:
Cloudera позволяет вам развертывать Apache Hadoop и управлять им, манипулировать и анализировать ваши данные, а также обеспечивать безопасность и защиту этих данных.
Шаги по открытию Cloudera после установки
Шаг 1. На вашем настольном компьютере доступна рабочая станция VMware. Откройте это.
Шаг 2: Теперь вы получите интерфейс. Нажмите, чтобы открыть виртуальное устройство.
Шаг 3: Выберите путь - на этом шаге вы должны выбрать путь и файл, в который вы загрузили файл.
Шаг 4: Теперь ваша виртуальная среда создается.
Шаг 5: Вы можете просмотреть сведения о своей виртуальной машине по этому пути.
Шаг 6: Теперь откройте терминал, чтобы начать работу с командами улья.
Шаг 7: Теперь введите hive в терминал. Это даст следующий результат.
[cloudera @ quickstart ~] $ hive 2020-12-09 20: 59: 24,314 WARN [main] mapreduce.TableMapReduceUtil: Jar-файл модуля hbase-prefix-tree, содержащий PrefixTreeCodec, отсутствует. Продолжая без этого. Ведение журнала инициализировано с использованием конфигурации в файле: /etc/hive/conf.dist/hive-log4j.properties ВНИМАНИЕ: Hive CLI устарел, рекомендуется перейти на Beeline. улей>
Шаг 8: Теперь вы все настроены и готовы начать вводить команды улья.
Операции с базами данных в HIVE
1. Создайте базу данных
Синтаксис:
создать базу данных имя_базы_данных;
Пример:
создать базу данных geeksportal;
Выход:
2. Создание таблицы
Синтаксис:
создать database.tablename (столбцы);
Пример:
создать таблицу geeksportal.geekdata (id int, name string);
Здесь id и string - это два столбца.
Выход :
3. Показать базу данных
Синтаксис:
показать базы данных;
Вывод: Показать созданные базы данных.
4. Опишите базу данных
Синтаксис:
описать базу данных имя_базы_данных;
Пример:
описать базу данных geeksportal;
Вывод: отображение пути HDFS к конкретной базе данных.