Как установить Apache Pig в Linux?

Опубликовано: 18 Февраля, 2022

Pig - это платформа или инструмент высокого уровня, который используется для обработки больших наборов данных. Он обеспечивает высокий уровень абстракции для обработки через MapReduce. Он предоставляет язык сценариев высокого уровня, известный как Pig Latin, который используется для разработки кодов анализа данных.

Чтобы установить Apache Pig, в вашей системе должны быть установлены Hadoop и Java.

Шаг 1. Загрузите новую версию Apache Pig по этой ссылке. В моем случае я загрузил последнюю версию Pig pig-0.17.0.tar.gz размером около 220 МБ.

Шаг 2: Теперь переместите загруженный tar-файл Pig в желаемое место. В моем случае я перемещаю его в свою папку / Documents.

Шаг 3: Теперь мы извлекаем этот tar-файл с помощью следующей команды (не забудьте проверить имя файла tar):

 tar -xvf свинья-0.17.0.tar.gz

Шаг 4. После установки нам пора переключиться на нашего пользователя Hadoop. В моем случае это hadoopusr . Если вы не создали отдельного выделенного пользователя для Hadoop, то в этом случае нет необходимости перемещать этот файл и устанавливать путь в соответствии с вашим ПУТЬЕМ PIG в файле .bashrc. Чтобы переключить пользователя, вы можете использовать команду ниже, или вы также можете переключиться вручную с помощью настроек переключателя.

 su - hadoopusr

Шаг 5: Теперь нам нужно переместить эту извлеченную папку пользователю hadoopusr. Для этого используйте команду ниже (убедитесь, что имя вашей извлеченной папки - pig-0.17.0, в противном случае измените его соответствующим образом)

 sudo mv свинья-0.17.0 / usr / local /

Шаг 6: Теперь, когда мы переместили его, нам нужно изменить переменную среды для местоположения Pig. Для этого откройте файл bashrc с помощью команды ниже.

 sudo gedit ~ / .bashrc

Once the file open save the below path inside this bashrc file.

#Pig location
export PIG_INSTALL=/usr/local/pig-0.17.0
export PATH=$PATH:/usr/local/pig-0.17.0/bin

Шаг 7: Затем проверьте, правильно ли вы настроили его, используя следующую команду:

 источник ~ / .bashrc

Шаг 8: Как только вы поняли, что все правильно, мы успешно установили pig в нашу настройку с одним узлом Hadoop, теперь мы запускаем pig с помощью команды ниже pig.

 свинья

Шаг 9: Вы можете проверить свою версию свиньи с помощью следующей команды.

 свинья версия