美文网首页
Hive 企业使用优化一

Hive 企业使用优化一

作者: 明明德撩码 | 来源:发表于2018-03-19 23:53 被阅读14次

Hive优化之一fetch task。

优化场景,

1、当在hive中执行select * from emp全部查询时及过滤属性字段
2、当在hive中执行分区查询
3、当查询前10/20笔数据这样的LIMIT
执行以上操作时不执行MapReduce

优化方法

在hive-site.xml中添加 hive.fetch.task.conversion 配置,见下面的描述

<property>
  <name>hive.fetch.task.conversion</name>
  <value>more</value>
  <description>
    Some select queries can be converted to single FETCH task minimizing latency.
    Currently the query should be single sourced not having any subquery and should not have
    any aggregations or distincts (which incurs RS), lateral views and joins.
    1. minimal : SELECT STAR, FILTER on partition columns, LIMIT only
    2. more    : SELECT, FILTER, LIMIT only (TABLESAMPLE, virtual columns)
  </description>
</property>

测试优化方法

退出hive命令行,重新进入命令行,因为hive-site.xml配置文件中添加了属性配置。
前后比较

没加配置前
加配置后
其他测试

相关文章

  • Hive 企业使用优化一

    Hive优化之一fetch task。 优化场景, 1、当在hive中执行select * from emp全部查...

  • Hive企业使用优化二

    大表【拆分】 子表根据实际业务可以把大表拆分为几个小表。例如可以把merit_log20180304表拆分出ip,...

  • Hive优化

    Hive优化 今天的主要内容——Hive优化 Fetch抓取Hive 中对某些情况的查询可以不必使用 MapRed...

  • 「Hive进阶篇」万字长文超详述hive企业级优化

    肝了几个晚上,梳理总结了一份万字长文超详述hive企业级优化文章,也整理了一份hive优化总结思维导图和hive优...

  • 数仓--Hive-面试之Hive优化策略

    Hive的优化策略大致分为:配置优化(hive-site.xml和hive-cli执行前配置)、表优化、hive数...

  • Hive 公司调优总结(一)

    1.开启Fetch抓取 Hive优化(十四)- Fetch抓取(Hive可以避免进行MapReduce) 2.使用...

  • Hive优化

    Hive简单优化与定期ETL Hive优化 Hive的执行依赖于底层的MapReduce作业,因此对Hadoop作...

  • Hive性能优化

    Hive性能优化 1.概述继续《那些年使用Hive踩过的坑》一文中的剩余部分,本篇博客赘述了在工作中总结Hive的...

  • Hive查询HBase调用MapReduce性能优化

    折腾了很久,被领导天天督促&指点,算是有个最基本的性能优化。 1. 背景介绍: Hive使用hive-hbase-...

  • Hive优化

    Hive数据倾斜优化总结 Hive数据倾斜优化分为配置优化和SQL优化 优先原则: 数据不怕多,避免倾斜。 减少J...

网友评论

      本文标题:Hive 企业使用优化一

      本文链接:https://www.haomeiwen.com/subject/qwqifftx.html