hive join的深入解析

作者: hoose | 来源:发表于2018-08-14 20:27 被阅读20次

hive在大数据体系中占着很重要，并且很大的角色，我们知道，hive虽然开始只是为了让一些不擅长写MR
的人员，为了方便他们查询数据而生的一个基于Hadoop的查询工具，但hive现在被更多的框架所见解，包括
SparkSQL,Impala,等
我们知道hive的默认计算引挚是MapReduce,所以分Map Reduce两个阶段，其中有一个很重要的过程叫做Shuffle,它
就是制约hive运行慢的最重要的一个因素。

我们在查询一些数据时，不可避免的会用到join连接，其实join对于我们这些程序员来说非常的熟悉，不管是java开发，net等
都会用sql join
那么Hive join与我们传统的关系性数据中的join有哪些不同呢？

hive join 主要是分三类：

 1.Common Join/ Shuffle Join/Reduce Join
 2. Map Join
 3.Sort Merge Bucket Join

网友评论

本文标题：hive join的深入解析

本文链接：https://www.haomeiwen.com/subject/akkbbftx.html

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！

hive join的深入解析

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读