Hive概论

作者: _Unique_楠楠 | 来源:发表于2020-05-20 10:15 被阅读0次

1.什么是Hive

  • Hive : 由Facebook 开源用于解决 <u>海量结构化日志</u> 的数据统计。

  • Hive是基于Hadoop的一个<u>数据仓库工具</u>,可以将 <u>结构化的数据文件映射为一张表</u> ,并提供 <u>类SQL</u> 查询功能

    本质是:将HQL转为MapReduce程序

  • Hive处理的数据存储在Hdfs

  • Hive分析数据底层的实现 <u>默认是 MapReduce</u> (可以换成其他的)

  • Hive运行程序是在yarn上的

    总结:可以吧Hive理解为一个客户端,方便你去调度Hadoop,所以它不是一个分布式的框架,而是一个客户端工具。


    image

2.Hive的优缺点

2.1 优点

  • 操作接口采用类SQL写法,提供快速开发能力
  • 避免了写MapReduce,减少学习成本
  • Hive执行的延迟比较高,因此Hive常用于数据分析,对实时性要求不高的场景
  • Hive优势在于处理大数据,对于小数据处理没有优势
  • Hive支持用户自定义函数,用户可根据自己的需求定义函数

2.2缺点

  • Hive的HQL表达能力有限
    • 迭代式算法无法表达
    • 数据挖掘方面不擅长
  • Hive的效率比较低
    • Hive自动生成的MapReduce作业,通常情况下不够智能
    • Hive调优比较困难,粒度较粗

相关文章

  • Hive概论

    1.什么是Hive Hive : 由Facebook 开源用于解决 海量结构化日志 的数据统计。 Hive是基...

  • 数据仓库Hive

    Hive产生背景 Hive概述 HIve体系架构 Hive部署架构 Hive和RDBMS区别 Hive部署以及快速...

  • 数据查询-Hive基础

    outline 什么是Hive 为什么需要Hive Hive的架构 Hive的常用操作 什么是Hive Hive由...

  • 大数据知识 | hive初识

    hive简介 hive架构 hive是什么 官网这样说:https://hive.apache.org/ hive...

  • Hive | Hive 安装详解

    一、Hive 介绍 二、准备工作 三、Hive下载 四、Hive 安装 五、Hive 启动 一、Hive 介绍 H...

  • Hive日常使用

    hive 创建表: hive 执行: =========================hive 调用Python...

  • Hive常用的几种交互操作

    查看hive下的交互命令方式 -help(hive 外) 命令:bin/hive -helpusage: hive...

  • 【Hive】

    Hive的安装 Hive官网地址 http://hive.apache.org/[http://hive.apac...

  • Hive进阶

    hive配置,命令 hive查询显示列名 hive默认分隔符 \001 hive命令行中查看当前hive环境变量 ...

  • Hive 入门

    Hive官网 Hive概述 Hive 的底层执行引擎有 :MapReduce,Tez,Spark- Hive on...

网友评论

    本文标题:Hive概论

    本文链接:https://www.haomeiwen.com/subject/jjlgohtx.html