美文网首页
大数据处理架构

大数据处理架构

作者: x_no_one | 来源:发表于2018-07-02 23:51 被阅读49次
大数据处理的关键架构层
大数据分析处理架构图  

数据源:除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而特别要说的是流数据,它的核心就是数据的连续性和快速分析性;

计算层:内存计算中的Spark是UC Berkeley的最新作品,思路是利用集群中的所有内存将要处理的数据加载其中,省掉很多I/O开销和硬盘拖累,从而加快计算。而Impala思想来源于Google Dremel,充分利用分布式的集群和高效存储方式来加快大数据集上的查询速度,这也就是我上面说到的近似实时查询;底层的文件系统当然是HDFS独大,也就是Hadoop的底层存储,现在大数据的技术除了微软系的意外,基本都是HDFS作为底层的存储技术。上层的YARN就是MapReduce的第二版,和在一起就是Hadoop最新版本。基于之上的应用有Hive,Pig Latin,这两个是利用了SQL的思想来查询Hadoop上的数据。


参考链接:
大数据分析处理框架——离线分析(hive,pig,spark)、近似实时分析(Impala)和实时分析(storm、spark streaming)
大数据处理的关键架构层

相关文章

  • Go语言学习笔记-常见架构模式的实现

    架构模式 pipe-filter 非常适合数据处理及数据分析系统 Filter封装数据处理的功能 松耦合,Filt...

  • 02-flink数据处理架构引入

    一、传统数据处理架构 Compute:计算层Storage:存储层CRM(customer relation ma...

  • [置顶][Lambda]架构~实时大数据处理的Lambda架构

    用于实时大数据处理的Lambda架构 - 51CTO.COMhttp://developer.51cto.com/...

  • Druid架构分析

    lambda架构 druid采用lambda架构,将实时数据和批处理数据解耦。 实时数据处理面向写多读少的优化,批...

  • 图解数据

    数据架构 数据处理过程 案例 数据采集 数据存储 HDFS read HDFS[1] write HDFS[2] ...

  • Kafka 详解一 简介

    目录 Kafka 是什么 Kafka 核心组 Kafka 整体架构以及解析 Kafka数据处理步骤 Kafka名词...

  • kafka详解

    目录 Kafka 是什么 Kafka 核心组 Kafka 整体架构以及解析 Kafka数据处理步骤 Kafka名词...

  • LollipopGo架构 v1.0.20181214更新

    Golang语言社区 LollipopGo架构 v1.0.20181214更新: 1 增加活动、匹配服务器数据处理...

  • 大数据处理架构

    数据源:除该种方法之外,还可以分为离线数据、近似实时数据和实时数据。按照图中的分类其实就是说明了数据存储的结构,而...

  • 大数据处理架构

    Hadoop Hadoop 是一个开源的,可运行于大规模集群上的分布式计算平台 Hadoop 两大核心 HDFS ...

网友评论

      本文标题:大数据处理架构

      本文链接:https://www.haomeiwen.com/subject/mzbruftx.html