Hive客户端工具后续将使用Beeline 替代HiveCLI ,并且后续版本也会废弃掉HiveCLI 客户端工具,Beeline是 Hive 0.11版本引入的新命令行客户端工具,它是基于SQLLine CLI的JDBC客户端。
Beeline支持嵌入模式(embedded mode)和远程模式(remote mode)。在嵌入式模式下,运行嵌入式的Hive(类似Hive CLI),而远程模式可以通过Thrift连接到独立的HiveServer2进程上。从Hive 0.14版本开始,Beeline使用HiveServer2工作时,它也会从HiveServer2输出日志信息到STDERR。
1. beeline 的常用参数
Option Description
--autoCommit=[true/false] ---进入一个自动提交模式:beeline --autoCommit=true
--autosave=[true/false] ---进入一个自动保存模式:beeline --autosave=true
--color=[true/false] ---显示用到的颜色:beeline --color=true
--delimiterForDSV= DELIMITER ---分隔值输出格式的分隔符。默认是“|”字符。
--fastConnect=[true/false] ---在连接时,跳过组建表等对象:beeline --fastConnect=false
--force=[true/false] ---是否强制运行脚本:beeline--force=true
--headerInterval=ROWS ---输出的表间隔格式,默认是100: beeline --headerInterval=50
--help ---帮助 beeline --help
--hiveconf property=value ---设置属性值,以防被hive.conf.restricted.list重置:beeline --hiveconf prop1=value1
--hivevar name=value ---设置变量名:beeline --hivevar var1=value1
--incremental=[true/false] ---输出增量
--isolation=LEVEL ---设置事务隔离级别:beeline --isolation=TRANSACTION_SERIALIZABLE
--maxColumnWidth=MAXCOLWIDTH ---设置字符串列的最大宽度:beeline --maxColumnWidth=25
--maxWidth=MAXWIDTH ---设置截断数据的最大宽度:beeline --maxWidth=150
--nullemptystring=[true/false] ---打印空字符串:beeline --nullemptystring=false
--numberFormat=[pattern] ---数字使用DecimalFormat:beeline --numberFormat="#,###,##0.00"
--outputformat=[table/vertical/csv/tsv/dsv/csv2/tsv2] ---输出格式:beeline --outputformat=tsv
--showHeader=[true/false] ---显示查询结果的列名:beeline --showHeader=false
--showNestedErrs=[true/false] ---显示嵌套错误:beeline --showNestedErrs=true
--showWarnings=[true/false] ---显示警告:beeline --showWarnings=true
--silent=[true/false] ---静默方式执行,不显示执行过程信息:beeline --silent=true
--truncateTable=[true/false] ---是否在客户端截断表的列
--verbose=[true/false] ---显示详细错误信息和调试信息:beeline --verbose=true
-d <driver class> ---使用一个驱动类:beeline -d driver_class
-e <query> ---使用一个查询语句:beeline -e "query_string"
-f <file> ---加载一个文件:beeline -f filepath 多个文件用-e file1 -e file2
-n <username> ---加载一个用户名:beeline -n valid_user
-p <password> ---加载一个密码:beeline -p valid_password
-u <database URL> ---加载一个JDBC连接字符串:beeline -u db_URL
2.beeline连接
2.1 连接方式一
lenmom@Mi1701 ~$ beeline
Beeline version 1.2.1.spark2 by Apache Hive
beeline>!connect jdbc:hive2://localhost:10000/default
Connecting to jdbc:hive2://localhost:10000/default
Enter username for jdbc:hive2://localhost:10000/default: lenmom
Enter password for jdbc:hive2://cdh-server2:10000/default: *****
Connected to: Apache Hive (version 2.3.4)
Driver: Hive JDBC (version 2.3.4)
Transaction isolation: TRANSACTION_REPEATABLE_READ
0: jdbc:hive2://localhost:10014/default> show databases;
+----------------+--+
| database_name |
+----------------+--+
| default |
| orc |
+----------------+--+
2.2 连接方式二
beeline -u "jdbc:hive2://localhost:10000" -n lenmom -p 123456
3.beeline常用操作
3.1 HIVE beeline使用shell 批量执行sql语句
#!/bin/sh
#--------------------------------------------
#Date:
#Author:
#------------------------------------------------
################################################
. /etc/profile
. ~/.bash_profile
################################################
sql14_pc="
insert into table uv_daybyday_bylimin
select 20170814,count(t.uv),'pctotal' from (select uv from UV_TOTAL_DAY_BYLIMIN where dt between 20170813 and 20170814 group by uv) t;
"
sql15_pc="
insert into table uv_daybyday_bylimin
select 20170815,count(t.uv),'pctotal' from (select uv from UV_TOTAL_DAY_BYLIMIN where dt between 20170813 and 20170815 group by uv) t;
"
#调用hive, 执行上面的sql
/usr/lib/hive/bin/beeline -u "jdbc:hive2://10.10.10.10:10000/bd_warehouse;principal=bd-warehouse" --hiveconf mapreduce.job.queuename=datacenter -e "${sql14_pc}" -e "${sql15_pc}"
3.2. 将查询结果输出到临时文件中
beeline -u "jdbc:hive2://dwtest-name1:10000/default" -n root --silent=true --outputformat=csv2 -hivevar logdate=${dt} -f script.q > ${file_tmp}
-f 对应查询的脚本 script.q
--outputformat=csv2 以逗号分隔
--silent=true 静默方式执行,注意:输出文件的时候必须以静默方式运行,否则输出的文本中带有很多程序执行信息。
上述命令执行完成后发现输出的文件中仍然有许多空白行,好像没有参数控制,无奈之下又使用shell命令来过滤空白行。
通过下面任意一行命令来过滤空白行,最后输出结果正常。
方式一:
#cat ${file_tmp} | sed -e '/^$/d' > ${file}
方式二:
grep -a -v "^$" ${file_tmp} > ${file}
网友评论