Hive初识

作者: 明明德撩码 | 来源:发表于2018-02-28 10:52 被阅读63次

背景

mapreduce编程的不变性,开发成本较高。比较死板。

  • MapReduce is hard to program

【八股文】格式编程,三大部分

  • No Schema, lack of query lanaguages, eg. SQL(没有库,缺乏查询语言slq等)

数据分析,针对DBA、SQL语句,如何对数据分析
MapReduce编程成本高
FaceBook 实现并开源Hive

如何简化MapReduce的开发???

hive介绍

hive把HDFS、yarn、MapReduce封装了。数据存储在hdfs、转换为MapReduce、运行在yarn上。hive是一个数据仓库。

什么是HIVE?

  • 由Facebook开源用于解决海量结构化日志的数据统计;

  • Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张表,并提供类SQL查询功能;

  • 构建在Hadoop之上的数据仓库;
    使用HQL作为查询接口;
    使用HDFS存储;
    使用MapReduce计算;

  • 本质是:将HQL转化成MapReduce程序

  • 灵活性和扩展性比较好:支持UDF,自定义存储格式等;

  • 适合离线数据处理;

  • HQL的核心是Engine。引擎的作用是把HQL转换为mapreduce

HIVE在hadoop生态中的位置

image.png

相关文章

  • hive基础入门与环境的搭建

    一、初识Hive 1、Hive简介     (1) 什么是Hive? Hive是基于Hadoop的一个数据仓库可以...

  • hive初识

    1、hive是个啥 1)hive主要是对mapreduce任务进行简化操作,方便工作人员快速进行数据分析; 2)h...

  • Hive初识

    背景 mapreduce编程的不变性,开发成本较高。比较死板。 MapReduce is hard to prog...

  • 初识Hive

    Hive是Facebook开源的用于解决海量结构化日志的数据统计工具。它是基于Hadoop的一个数据仓库工具,可以...

  • 初识Hive

    前言 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功...

  • Hive架构优点及使用场景

    先阅读初识hive Hive在大数据生态环境中的位置 Hive架构图 client 三种访问方式1、CLI(hiv...

  • Hive-初识HIVE(一)

    转载自:https://www.cnblogs.com/qingyunzong/p/8707885.html Hi...

  • Hive学习笔记(1)初识Hive

    Hive是一个数据仓库基础工具,在Hadoop中用来处理结构化的数据。它架构在Hadoop之上,hive底层数据存...

  • 大数据知识 | hive初识

    hive简介 hive架构 hive是什么 官网这样说:https://hive.apache.org/ hive...

  • 数据仓库Hive

    Hive产生背景 Hive概述 HIve体系架构 Hive部署架构 Hive和RDBMS区别 Hive部署以及快速...

网友评论

    本文标题:Hive初识

    本文链接:https://www.haomeiwen.com/subject/nffbxftx.html