美文网首页大数据开发
[hive]视图~Kylin实践之使用

[hive]视图~Kylin实践之使用

作者: 葡萄喃喃呓语 | 来源:发表于2016-10-23 12:54 被阅读22次

Kylin实践之使用Hive视图 - Hello World - 博客频道 - CSDN.NET
http://blog.csdn.net/yu616568/article/details/50548967
为什么需要使用视图

   Kylin在使用的过程中使用hive作为cube的输入,但是有些情况下,hive中的表定义和数据并不能满足分析的需求,例如有些列的值需要进行处理,有些列的类型不满足需求,甚至有时候在创建hive表时为了图方便,hive中的所有列都被定义成了string,因此很多情况下在使用Kylin之前需要对hive上的数据格式进行适当的修剪,但是使用alter table的方式修改hive原始的schema信息未免会对其它依赖hive的组件有所影响(例如可能导致数据导入失败),于是不得不另辟蹊径,而此时使用hive的视图就是一个非常好的方案。

   当然,除了Hive数据源本身schema的限制之外,Kylin对于hive的使用还有一定的限制,这也间接的导致我们需要使用视图: 

1、同一个项目下使用相同表(可能根据不同的filter条件过滤,或者设置了不同的维度等)创建了不同的cube,会导致查询的时候定位到错误的cube。
2、只支持星状模型

相关文章

网友评论

    本文标题:[hive]视图~Kylin实践之使用

    本文链接:https://www.haomeiwen.com/subject/atckuttx.html