Категория: Hadoop

Распределенный кеш в Hadoop MapReduce
Фреймворк Hadoop MapReduce предоставляет возможность кэшировать небольшие или умеренные файлы, доступные только для чтения, такие как текстовые файлы,...подробнее
Как выполнить программу WordCount в MapReduce с помощью Cloudera Distribution Hadoop (CDH)
Предварительные требования: Hadoop и MapReduce Подсчитать количество слов в любом языке - это несложно, как в C, C ++, Python, Java и т. Д. MapReduce...подробнее
Сумма четных и нечетных чисел в MapReduce с использованием Cloudera Distribution Hadoop (CDH)
Предварительные требования: Hadoop и MapReduce Подсчитать количество четных и нечетных и найти их сумму на любом языке - это несложно, как в C, C ++,...подробнее
Как найти топ-N записей с помощью MapReduce
Поиск 10 или 20 лучших записей из большого набора данных - это сердце многих систем рекомендаций, а также важный атрибут для анализа данных. Здесь мы ...подробнее
Введение в Apache Pig
Pig - это платформа или инструмент высокого уровня, который используется для обработки больших наборов данных. Он обеспечивает высокий уровень абстрак...подробнее
Интеграция Hadoop и языка программирования R
Hadoop - это среда с открытым исходным кодом, представленная ASF - Apache Software Foundation . Hadoop - это самая важная платформа для работы с больш...подробнее
Как настроить Eclipse с Apache Hadoop?
Eclipse - это IDE (интегрированная среда разработки), которая помогает создавать и строить приложение в соответствии с нашими требованиями. А Hadoop и...подробнее
Как установить Hadoop в кластер с одним узлом в Windows?
Hadoop можно установить двумя способами. Первый - в кластере с одним узлом, а второй - в кластере с несколькими узлами. Давайте посмотрим на объяснени...подробнее
Создание таблицы базы данных с использованием языка запросов Hive (HQL)
Hive - это решение для хранилища данных, построенное на основе Hadoop. В Hive данные управляются в распределенной файловой системе Hadoop (HDFS). В эт...подробнее
Разница между HDFS и HBase
HDFS : Распределенная файловая система Hadoop - это распределенная файловая система, предназначенная для хранения и работы на нескольких машинах, кото...подробнее