美文网首页数客联盟
Sql-On-Hadoop的流程简要分析

Sql-On-Hadoop的流程简要分析

作者: WestC | 来源:发表于2018-10-03 23:25 被阅读59次

基于Hadoop的sql方案如hive,sparksql架构一般如下:

  • Server : ThriftServer 完成sql的解析及应用(如MR,Spark,Tez)的提交
  • 传统数据库 : 用于存储表的元数据,常见的由Mysql,postgreSql等
  • 管理元数据: MetaStore,作为ThriftServer和传统数据库的桥梁
  • 数据存储 : HDFS

Hive Sql执行流程图

HiveSql执行力流程.jpg

SparkSql 执行流程图

SparkSql是基于spark Core的 onHadoop的sql解决方案。有多种sql解决方案,如通过启动Server的方式对客户端提交sql方案,客户端sql可通过beeline,JDBC的接口完成sql的解析执行。也可以直接调用sparkApi完成sql执行。

ThriftServer模式的sql方案

SparkSql流程.jpg

SparkApi模式的sql方案

Spark Sql 流程.jpg

相关文章

网友评论

    本文标题:Sql-On-Hadoop的流程简要分析

    本文链接:https://www.haomeiwen.com/subject/fhutaftx.html