美文网首页工作生活
Pig | 安装与操作

Pig | 安装与操作

作者: icebreakeros | 来源:发表于2019-07-04 07:57 被阅读0次

pig

Pig是一个用来处理大规模数据集的平台,由Yahoo贡献给Apache
Pig方便不熟悉java的用户,使用一种较为简便的类似于SQL的面向数据流的语言pig Latin进行数据处理
Pig Latin可以进行排序、过滤、求和、分组、关联等常用操作,还可以自定义函数,这是一种面向数据分析处理的轻量级脚本语言
Pig可以看做是Pig LatinMapReduce的映射器
Pig可以自动对集群进行分配和回收,并且自动地对MapReduce程序进行优化

pig

pig安装

wget -c http://www-eu.apache.org/dist/pig/latest/pig-0.17.0.tar.gz
tar -zxvf pig-0.17.0.tar.gz && mv pig-0.17.0 /usr/local/
cd /usr/local/ && ln -s pig-0.17.0/ pig

cat >> /etc/profile << EOF

# for pig
export PIG_HOME=/usr/local/pig
export PIG_CLASSPATH=\$HADOOP_HOME/etc/hadoop
export PATH=\$PIG_HOME/bin:\$PATH
EOF

source /etc/profile
mkdir -p /log/pig/
echo "pig.logfile=/log/pig/pig-err.log" >> conf/pig.properties

pig -x mapreduce
> pwd
> ls ./

Pig Latin

LOAD:载入原始数据,将原始数据文件内容转换为Pig的数据模型
DUMP:将结果显示到屏幕
FOREACH:对输入数据中的Tuple逐个进行处理
FILTER:过滤数据
STORE:将结果保存在文件系统中
DESCRIBE:返回一个名称的模式
EXPLAIN:显示脚本的执行计划
ILLUSTRATE:跟踪程序的执行过程

A = LOAD 'score.txt' USING PigStorage(',') AS (id:int,name,score:int);
DUMP A;
B = FOREACH A GENERATE name,score;
DUMP B;
X = FILTER B BY score>96 AND score<100;
DUMP X;
STORE B INTO '/data/finish' USING PigStorage('\t');
DESCRIBE B;

相关文章

  • Pig | 安装与操作

    pig Pig是一个用来处理大规模数据集的平台,由Yahoo贡献给ApachePig方便不熟悉java的用户,使用...

  • pig安装

    1.下载Pig,网址:http://hadoop.apache.org/pig/releases.html。 2....

  • pig 导出导入

    1. 安装pig 下载 pig-0.17.0.tar.gz解压到~/ 2. 编写pig 导出脚本 3. 将 pho...

  • Pig从入门到精通2:Pig安装配置

    Pig的安装模式有两种:本地模式和MapReduce模式(集群模式)。二者的区别是:本地模式操作的是本地Linux...

  • Pig学习与实践

    本文架构 1.什么是pig 2.pig有什么作用 3.如何使用 pig 4.pig最佳实践与进阶 5.参考资料 1...

  • Linux命令指南

    一、安装 二、文件操作 目录操作 创建与删除 复制与移动 查看内容 三、打包与解压 四、软件安装与管理 4.1 U...

  • pig 编译及安装

    这篇文章我写的是集群方式的,如果是单节点且不需要持久化可以参考文章https://www.jianshu.com/...

  • Pig 安装及使用

    一、Pig简介 1、Pig与Mapreduce当业务比较复杂的时候,使用MapReduce将会是一个很复杂的事情,...

  • egg-mysql

    一. 安装与配置 二. 操作

  • 代写c++ Application Development us

    Introduction根据题目需求完成一个名字叫PIG的小游戏,用到了c++的类的封装等操作,分为玩家与玩家和电...

网友评论

    本文标题:Pig | 安装与操作

    本文链接:https://www.haomeiwen.com/subject/xwepcctx.html