Hive count(DISTINCT id )

Hive count(DISTINCT id )

作者: 团团饱饱 | 来源:发表于2021-05-12 17:44 被阅读0次

Hive count(DISTINCT id )
sql 中多条件使用-if
hive、sql union关联，嵌套查询，分组排序查询等语法
Hive之COUNT DISTINCT优化
Hive SQL优化之 Count Distinct
01-mysql基础
hive sql优化实例
Hive Distinct的实现原理
select 重复列数量
Mysql第三天

SELECT count(DISTINCT orderid) FROM test.subOrderAllDetail

map 阶段的key 会全部汇总在一个reduce 上，导致一个reduce 处理所有数据。reduce 个数只有一个。不管你怎么设置参数：set mapred.reduce.tasks=100，实际执行任务的reduce 只有一个。

优化：
SELECT count(orderid)
FROM
(SELECT DISTINCT orderid
FROM test.subOrderAllDetail)tmp;

map 阶段对key 进行去重，在不同的task 上去重。之后发送到不同的reduce，reduce 个数不一定只有一个。可以通过set mapred.reduce.tasks=n 设置。

从而达到并行执行。

相关文章

Hive count(DISTINCT id )
SELECT count(DISTINCT orderid) FROM test.subOrderAllDe...
sql 中多条件使用-if
SELECT date_str, count(distinct if(new_id=1, device_id, n...
hive、sql union关联，嵌套查询，分组排序查询等语法
UNION 关联 select count (distinct user_id) from (select use...
Hive之COUNT DISTINCT优化
COUNT(DISTINCT xxx) 在hive中很容易造成数据倾斜。针对这一情况，网上已有很多优化方法，这里不...
Hive SQL优化之 Count Distinct
Hive是Hadoop的子项目，它提供了对数据的结构化管理和类SQL语言的查询功能。SQL的交互方式极大程度地降低...
01-mysql基础
1 null值注意 count数据丢失null值行 distinct数据丢失当使用count(distinct c...
hive sql优化实例
Hive中SQL的优化技巧，核心思想是避免数据倾斜。 1、避免在同一个查询中同时出现count, distinct...
Hive Distinct的实现原理
Distinct的实现原理 select dealid, count(distinct uid) num from...
select 重复列数量
select distinct count(*) AS count, VL_GUESTNAME from T_VI...
Mysql第三天
高级查询常用的分组函数 COUNT MIN MAX SUM AVG COUNT COUNT( [DISTINCT...

网友评论

本文标题：Hive count(DISTINCT id )

本文链接：https://www.haomeiwen.com/subject/bfoadltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|Hive count(DISTINCT id )|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！