* HUE搭配基础
首先简单说一下Hue框架的来源:HUE=HadoopUser Experience,看这名字就知道怎么回事了吧,没错,直白来说就是Hadoop用户体验,是一个开源的Apache Hadoop UI系统,由Cloudera Desktop演化而来,最后Cloudera公司将其贡献给Apache基金会的Hadoop社区,它是基于Python Web框架Django实现的。通过使用Hue我们可以在浏览器端的Web控制台上与Hadoop集群进行交互来分析处理数据。
简单来讲,就是用图形化的界面来操作HDFS上的数据,运行MapReduce Job,执行Hive的SQL语句,浏览Hbase数据库,oozie,flume等等。
官网网站:http://gethue.com/
在官网上可以看到,如下世界知名公司都在用(地球人用了都说好?)
* 安装HUE
官网安装帮助:http://archive.cloudera.com/cdh5/cdh/5/hue-3.7.0-cdh5.3.0/manual.html
** 安装依赖
如上图所示,这部分内容是告诉你,安装编译Hue需要依赖哪些Linux安装包,你只需要使用yum命令一次安装就可以了,在此给大家整理好该命令(注意使用root权限安装):
# yum -y install ant asciidoc cyrus-sasl-devel cyrus-sasl-gssapi gcc gcc-c++ krb5-devel libtidy libxml2-devel libxslt-devel openldap-devel python-devel sqlite-devel openssl-devel mysql-devel gmp-devel
尖叫提示:使用yum安装这些包的同时,也会自动安装openJDK的依赖,所以,请自行删除安装后的openJDK,忘记的同学请参考
** 下载HUE
你去官网下载是没有问题的,在此给你开个传送门:
链接:http://pan.baidu.com/s/1pKKSOSr 密码:5r51
** 解压HUE
$ tar -zxf hue-3.7.0-cdh5.3.6.tar.gz -C /opt/modules/cdh/
** 编译HUE
到hue安装目录下,执行make apps
$ make apps
大概等个几分钟之后,就编译成功了。
** 配置Hue
修改Hue.ini文件
文件位置:/opt/modules/cdh/hue-3.7.0-cdh5.3.6/desktop/conf/hue.ini
打开之后,更改如下属性:
其中secret_key密钥的值可以来Hue安装帮助中查看到,如下图位置:
** 启动HUE
完成之后呢,保存退出,我们来使用命令启动Hue
$ build/env/bin/supervisor,出现如下界面表示启动成功:
接下来使用浏览器来查看hue界面:
http://z01:8888,接着我们就看到如下界面:
这句话是在提示你,第一次使用本工具,需要创建一个用户及密码,且会成为hue的超级用户凭证,在此呢,我设置为admin用户名,密码随意,那就123456吧,然后呢就可以见到如下界面了:
* HUE与Hadoop集成
当前集群环境:
NameNode与Resourcemanager均已配置HA与前几节教程一致(Bootstrap一会再说)** 配置Hadoop文件
hdfs-site.xml
添加如图内容:
core-site.xml
添加如图内容:
httpfs-site.xml
配置内容如图:
我来解释一下:
1、如果没有配置NameNode的HA,HUE可以用WebHDFS来管理HDFS
2、如果配置了NameNodeHA,则HUE只可用HttpFS来管理HDFS
由于第一种方案官方说明中有完整示例,而且基于本例是在完全分布式且HA环境已经部署的情况下搭建的,所以,采用第二种方式。即配置如上,请大家注意。
尖叫提示:
1、Hadoop相关文件配置完成后,scp拷贝到其他机器节点
2、配置完成后呢,记得重启整个Hadoop集群
3、在z01机器节点上,在hadoop根目录下,使用sbin/httpfs.sh start来启动Bootstrap进程,以服务HttpFS管理
** 修改Hue.ini文件,先找到[[hdfs_clusters]]这个标签,然后修改如下图:
mycluster是我在core-site.xml和hdfs-site.xml中设置的集群名称,请自行查看自己的,如果你遵从了前几节的内容,则我们应该是一致的。** 修改Hue.ini文件,先找到[[yarn_clusters]]这个标签,然后修改如下图:
cluster-yarn1请到yarn-site.xml中查看** 重启HUE并测试
先使用Ctrl+C关闭HUE服务,再使用如下命令重启:
$ build/env/bin/supervisor
测试HDFS点进:File Browser选项查看如图:
可以进行删除,上传等操作测试Yarn点进:Job Browser选项查看如图:
注意红框内的内容,我是按照之前提交任务的人物名来查看任务的历史记录的,可以自行到yarn中查看用户名是什么,如图:
* HUE与Hive集成
** 配置Hive文件
hive-site.xml
HUE与hive集成需要hive开启HiveServer2服务
修改如下内容如图:
** 启动Hive服务
进入Hive根目录,使用命令启动服务,末尾加上&符号,让脚本在后台运行,不至于占用终端:
$ bin/hive --service metastore &
$ bin/hive --service hiveserver2 &
尖叫提示:如果设置了uris,那么必须启动如上两个命令,否则Hive无法正常启动
** 配置Hue.ini
找到[beeswax]这个标签,配置如下:
然后重启Hue服务,在“查询编辑器”中选择Hive,即可看到如下界面,我们之前创建的一个表,查询一下试试:
* HUE与Mysql集成
** 配置Hue.ini
找到[[[mysql]]]标签,修改内容如下:
** 配置完成,重启Hue,点击“DB查询”,看到如图内容:
* Hue与Oozie集成
** 配置Hue.ini
找到[liboozie]以及[oozie]标签,修改内容如下:
** 修改Oozie配置文件
oozie-site.xml
修改一下oozie的时区,如下:
** 启动Oozie相关服务
进入到Oozie安装根目录,然后执行命令:
$ bin/oozied.sh start
然后重启Hue服务,点击Workflow-仪表板-Workflow,之前我们练习的历史记录如下:
配置完成后,可以非常简单方便的使用图形化界面创建Oozie任务,因为过于简单,在此不再赘述,请自行体验。
* 总结
这一节我们使用Hue工具将之前使用的工具和框架通过图形界面化的形式展示出来并操作,方便了日常维护和开发,里面的种种细节,请同学们自行琢磨。
IT全栈公众号:
QQ大数据技术交流群(广告勿入):476966007
网友评论