>作者:Neshoir
大数据环境搭建是一项比较复杂的工作,因为其依赖的大数据基础平台组件较多,导致很多基础薄弱的伙伴在搭建环境时遇到各种不顺,索性我们定制化了两个一键部署包产品,产品包里包含了虚拟机系统,hadoop组件,hbase组件,spark组件等。定制化的产品包的好处就是,虚拟机系统已经内置了一些依赖库或环境,hadoop等组件已配置好相关的属性。所有的部署过程都编写了自动化部署的脚本,小伙伴只需要按下面的步骤进行,即可体验全套的大数据产品。
一、产品包下载
目前在CentOS 7.5和Ubuntu 16.04系统上做了定制化及优化。产品包里有虚拟机操作系统和一键安装包。注:如果在其他Linux系统上安装部署,必须安装ssh服务,软件版本微调,需要在脚本里替换软件的名称。提取码:xujb
-
-
onestep-CentOS 7.5
-
onestep-Ubuntu 16.04
二、虚拟机环境准备(以centos为例)
-
-
解压centos-7.5.rar包,复制三份。
-
用VMware(12.5以上版本)打开三台centos系统。
-
分别用root用户登录,密码为test。
-
用命令:ifconfig,查看三台机器的ip,建议将其ip配置为固定ip。
-
由于三台机器复制的名称是一样的,分别将三台机器的名称改为 master.com,node1.com,node2.com。命令:
-
-
hostnamectl set-hostname master.com
三、onestep一键部署包配置
-
-
将onestep.tar包上传到master.com机器的/home目录下,并解压
```shell
tar -xvf onestep.tar
```
-
-
编辑onestep/conf/host.conf文件,新增各节点机器信息,格式:机器ip 机器名称 root用户密码
-
-
编辑onestep/conf/init.conf文件,设置安装用户,软件,路径等,信息如截图,注:不需预先创建用户
-
-
准备脚本的执行,检查bin和expect目录所有文件,是否有执行权限,顺利安装成功会显示“初始化完毕!”
``shell
# 如果没有权限,赋予权限
chmod 777 *
#
root用户下执行准备脚本,主要安装expect,ntp同步时间,关闭防火墙,安装jdk
bin/01preinstall.sh
```
-
-
另外两台机器也会安装,登录到node1.com机器,验证时间同步服务和jdk。
-
-
# 验证时间同步服务
ntpstat
# 切换到supermap用户,验证jdk
su supermap #输入密码
java -version
四、节点机器之间安装ssh服务
在master.com机器上,切换到supermap用户,执行如下脚本:
su
supermap #输入密码
bin/02installssh.sh #安装ssh服务
五、安装各组件包
在master.com机器上,切换到supermap用户,执行如下脚本:
su
supermap
#输入密码
bin/03installSoft.sh #安装hadoop,hbase,spark等组件,需要耗时几分钟
六、验证各个组件
执行命令 ./start_all.sh 脚本,启动所有组件
-
-
hadoop组件的ui地址:http://master.com:50070/dfshealth.html#tab-datanode
-
-
hbase组件的ui地址:http://master.com:60000/master-status
-
-
spark组件的ui地址:http://master.com:8080/
至此大数据组件的快速部署完成,可以用spark组件或者iServer进行大数据分析任务。注:iServer可以配置集群,iServer开启分布式服务可以支持外部的spark standalone以及spark on yarn模式,具体配置参考iServer开启集群配置文档和iServer开启分布式服务相关博客。
网友评论