hive 数据倾斜

hive 数据倾斜

作者: 团团饱饱 | 来源:发表于2021-05-12 17:47 被阅读0次

Hive优化
hive 优化-1
Hive数据倾斜
Hive 数据倾斜
HIVE：数据倾斜
Hive 数据倾斜
Hive数据倾斜
hive 数据倾斜
hive的数据倾斜操作
Spark 数据倾斜调优

1、Hive 不同数据类型关联产生数据倾斜

情形：比如用户表中 user_id 字段为 int，log 表中 user_id 字段既有 string 类型也有 int 类型。当按照 user_id 进行两个表的 Join 操作时。
后果：处理此特殊值的 reduce 耗时；只有一个 reduce 任务
默认的 Hash 操作会按 int 型的 id 来进行分配，这样会导致所有 string 类型 id 的记录都分配
到一个 Reducer 中。
解决方式：把数字类型转换成字符串类型
select * from users a
left outer join logs b
on a.usr_id = cast(b.user_id as string)

总结:关联字段类型统一

2、key本身分布不均

可以在key上加随机数，或者增加reduceTask数量

开启数据倾斜时负载均衡
set hive.groupby.skewindata=true;
思想：就是先随机分发并处理，再按照 key group by 来分发处理。
操作：当选项设定为 true，生成的查询计划会有两个 MRJob。
第一个 MRJob 中，Map 的输出结果集合会随机分布到 Reduce 中，每个 Reduce 做部分聚合操作，并输出结果，这样处理的结果是相同的 GroupBy Key 有可能被分发到不同的Reduce 中，从而达到负载均衡的目的；

第二个 MRJob 再根据预处理的数据结果按照 GroupBy Key 分布到 Reduce 中（这个过程可以保证相同的原始 GroupBy Key 被分布到同一个 Reduce 中），最后完成最终的聚合操作。

相关文章

Hive优化
Hive数据倾斜优化总结 Hive数据倾斜优化分为配置优化和SQL优化优先原则：数据不怕多，避免倾斜。减少J...
hive 优化-1
join优化-数据倾斜hive.optimize.skewjoin=true; 【TODO 细节】数据倾斜时启动两...
Hive数据倾斜
数据倾斜 map reduce任务执行时，reduce节点任务大部分执行完毕，但是有一或几个reduce任务运行很...
Hive 数据倾斜
http://www.cnblogs.com/qingyunzong/p/8847597.htmlhttp://w...
HIVE：数据倾斜
一、Map倾斜根本原因：读入的文件块的数据分布不均匀。 1、上游表文件的大小不均匀，并且小文件特别多，导致当前表...
Hive 数据倾斜
现象：任务卡在map 100% reduce 99%，分布式计算时，优化目标：使map的结果更均匀的分布到red...
Hive数据倾斜
原文链接：https://my.oschina.net/134596/blog/1800029 在做Shuffle...
hive 数据倾斜
1、Hive 不同数据类型关联产生数据倾斜情形：比如用户表中 user_id 字段为 int，log 表中 us...
hive的数据倾斜操作
hive底层对应的是mr程序。需要注意数据倾斜问题： Hive进阶数据倾斜在我们数据清洗过程中，经常会出现一种...
Spark 数据倾斜调优
1.使用Hive ETL预处理数据方案适用场景：如果导致数据倾斜的是Hive表。如果该Hive表中的数据本身很不...

网友评论

本文标题：hive 数据倾斜

本文链接：https://www.haomeiwen.com/subject/xyoadltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|hive 数据倾斜|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！