1.执行引擎变更:TEZ
不用支持缓慢过时的MapReduce了,14年测试时TEZ比MapReduce快100%。
2.鉴权变更:Ranger
Hive默认使用storage-based authorization (SBA) ,HDP使用Ranger,Cloudera使用Sentry,Sentry 到后面感觉复杂又不好用。不知道Hortonworks和Cloudera合并后哪个占优势。
3.HDFS ACLs默认打开
大数据初始没有安全可言,现在都默认标配了。
4.ACID和LLAP支持
ACID用于支持大数据事务,已经成熟,默认打开
LLAP用于支持秒级、毫秒级访问,已经成熟,哪天测试下。
5.Hive 客户端变更
老旧的Hive CLI已经sunset,使用Hive CLI需要打开整个Hive代码库。
Beeline成了标配。
6.Hive Metastore变更
不再支持embedded Metastore,得打开独立服务了。
7.Spark catalog变更
不再和Hive catalog放一块,但可以相互访问
8.查询引擎变更
批处理使用TEZ、实时查询使用LLAP。
网友评论