Impala工具下载地址
下载:bigtop-utils-0.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.30.el7.noarch.rpm
安装Impala的其他依赖
yum install -y cyrus-sasl-plain lsb
安装Hadoop、Hive(安装方式自行百度)
安装Impala
主节点安装
sudo rpm -ivh bigtop-utils-0.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.30.el7.noarch.rpm
sudo rpm -ivh impala-kudu-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm --nodeps
sudo rpm -ivh impala-kudu-catalog-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
sudo rpm -ivh impala-kudu-server-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
sudo rpm -ivh impala-kudu-state-store-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
sudo rpm -ivh impala-kudu-shell-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
sudo rpm -ivh impala-kudu-udf-devel-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
从节点安装
sudo rpm -ivh bigtop-utils-0.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.30.el7.noarch.rpm
sudo rpm -ivh impala-kudu-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm --nodeps
sudo rpm -ivh impala-kudu-server-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
sudo rpm -ivh impala-kudu-shell-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
sudo rpm -ivh impala-kudu-udf-devel-2.7.0+cdh5.9.0+0-1.cdh5.9.0.p0.11.el7.x86_64.rpm
配置Impala-bigtop-utils
vim /etc/default/bigtop-utils(主从节点)
修改JAVA_HOME
配置Impala(主从节点)
vim /etc/default/impala
修改主节点域名
修改Hadoop配置文件
core-site.xml、hdfs-site.xml
# core-site.xml
<!--impala configuration -->
<property>
<name>dfs.client.read.shortcircuit</name>
<value>true</value>
</property>
<property>
<name>dfs.client.read.shortcircuit.skip.checksum</name>
<value>false</value>
</property>
<property>
<name>dfs.datanode.hdfs-blocks-metadata.enabled</name>
<value>true</value>
</property>
#hdfs-site.xml
<!--impala configuration -->
<property>
<name>dfs.datanode.hdfs-blocks-metadata.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.block.local-path-access.user</name>
<value>impala</value>
</property>
<property>
<name>dfs.client.file-block-storage-locations.timeout.millis</name>
<value>60000</value>
</property>
<property>
<name>dfs.domain.socket.path</name>
<value>/var/run/hadoop-hdfs/dn._PORT</value> #hadoop-hdfs手动创
</property>
配置整合Hdfs、Hive
配置impala的conf文件(主从节点)
hadoop配置文件:core-site.xml、hdfs-site.xml
hive配置文件 :hive-site.xml
拷贝到/etc/impala/conf.dist/目录下
重启Hadoop集群
设置Socket path
在目录/var/run/目录下新建目录hadoop-hdfs(主从节点)
注意:该文件夹可能已经存在,应当确认用impala是否有权限进行读写。如果已经存在
将用户impala加入该文件所属的组,并修改该文件组的权限即: chown -R 775 hadoop-hdfs/
[root@hadoop]# cd /var/run/ #进入目录/var/run/
[root@hadoop]# mkdir hadoop-hdfs #创建目录hadoop-hdfs文件夹
[root@hadoop]# chown -R 775 hadoop-hdfs/ #设置权限
权限配置
如果想要impala和yarn合作,需要把impala用户加入hdfs组(主从节点);
impala在执行drop table操作时,需要把文件移到到hdfs的回收站
所以需要创建一个hdfs的目录/user/impala,并将其设置为impala用户可写。
同样,impala需要读取hive数据仓库下的数据,故需要把impala用户加入hive组。
[root@hadoop]# usermod -G hdfs,hadoop impala
[root@hadoop]# groups impala
impala:impala hdfs hadoop
另:创建impala在hdfs上的目录并设置权限
[root@hadoop]$ hadoop fs -mkdir -p /user/impala
[root@hadoop]$ hadoop fs -chown impala /user/impala
添加Mysql驱动
在/var/lib/impala/目录下面添加mysql驱动jar
启动impala
主节点
[root@hadoop]# service impala-state-store restart
[root@hadoop]# service impala-catalog restart
[root@hadoop]# service impala-server restart
从节点
service impala-server restart
服务验证
注意:
1、因为impala安装需要root权限,所以可以给hadoop用户添加sudo权限
gpasswd -a hadoop wheel #root执行
网友评论