Категория: Hadoop

Как настроить Windows для создания проекта с кодом Apache Spark без его установки?
Apache Spark - это единый аналитический движок, который используется для обработки крупномасштабных данных. Apache Spark предоставляет функциональные ...подробнее
Улей - команды одним выстрелом
Hive поставляется с различными командами «One Shot», которые пользователь может использовать через Hive CLI (интерфейс командной строки) без входа в о...подробнее
Установка и настройка Hadoop в псевдо-распределенном режиме в Windows 10
Чтобы выполнить настройку и установку Hadoop в псевдораспределенном режиме в Windows 10, выполните следующие действия, указанные ниже. Обсудим по поря...подробнее
Операции с базами данных в HIVE с использованием CLOUDERA - VMWARE Work Station
Мы собираемся создать базу данных и создать таблицу в нашей базе данных. И расскажет об операциях с базами данных в HIVE с использованием CLOUDERA - V...подробнее
Установка Apache Pig в Windows и пример использования
Apache Pig - это инструмент для обработки данных, созданный на основе Hadoop MapReduce. Pig предоставляет нам язык сценариев для более простого и быст...подробнее
Что такое Hadoop Streaming?
Это утилита или функция, поставляемая с дистрибутивом Hadoop, которая позволяет разработчикам или программистам писать программу Map-Reduce с использо...подробнее
HDFS - операция чтения данных
HDFS - это распределенная файловая система, в которой данные хранятся в сети обычных машин. HDFS работает с шаблоном доступа к потоковым данным, что о...подробнее
Apache Spark со Scala - устойчивый распределенный набор данных
В современном мире мы ежедневно имеем дело с огромными наборами данных. Данные растут даже быстрее, чем скорость обработки. Выполнение вычислений на т...подробнее
Hadoop - библиотека Python mrjob для MapReduce с примером
mrjob - это известная библиотека Python для MapReduce, разработанная YELP. Библиотека помогает разработчикам писать код MapReduce с использованием язы...подробнее
Hive - Загрузить данные в таблицу
Таблицы Hive предоставляют нам схему для хранения данных в различных форматах (например, CSV). Hive предоставляет несколько способов добавления данных...подробнее