美文网首页
大数据架构演变 (1)

大数据架构演变 (1)

作者: 良人与我 | 来源:发表于2019-05-13 22:02 被阅读0次

大数据的架构介绍
日志采集为例(流程如下图所示)


image.png

需要的模块和组件

1.用户的app (上报日志)
2.log recv server (接收日志服务)
3.hdfs 集群 (保存日志)
4.kafka 集群
5.zookeeper 集群
6.flume (日志收集组件)
7.hive
8.hive server2 - HiveServer2 (HS2) is a server interface that enables remote clients to execute queries against Hive and retrieve the results
9.web server (客户查看日志统计分析结果的平台)

整个流程为

1.app 记录用户的行为log,在适当的时候,将日志发送到日志收集服务器(log-recv-server)
2.日志收集服务器 将日志提交到 kafka
3.flume 读取kafka 的日志并保存到 hdfs 中
4.通过定时任务(linux cron) 定时load 数据到 hive 中
5.B端用户 通过web端访问获取数据,通过hive-server2 查询hive 的数据。

次架构的不足之处

1.定时任务,有时间间隔,数据统计结果的延迟大
2.hive 的查询 耗时比较长。

相关文章

  • 魅族大数据运维平台实践

    一、大数据平台介绍 1.1大数据平台架构演变 如图所示魅族大数据平台架构演变历程: 2013年底,我们开始实践大数...

  • 魅族大数据运维平台实践

    一、大数据平台介绍 1.1大数据平台架构演变 如图所示魅族大数据平台架构演变历程: 2013年底,我们开始实践大数...

  • 魅族大数据运维平台实践

    一、大数据平台介绍 1.1大数据平台架构演变 如图所示魅族大数据平台架构演变历程: 2013年底,我们开始实践大数...

  • 大数据架构演变 (1)

    大数据的架构介绍日志采集为例(流程如下图所示) 需要的模块和组件 1.用户的app (上报日志)2.log rec...

  • 2019-04-19-主从复制架构演变-MHA高可用技术

    1. 主从复制架构演变介绍 1.1 基本结构 1.2 高级应用架构演变 1.2.1 高性能架构 (1)读写分离架构...

  • 网站架构演变过程

    网站架构演变过程 1.传统架构: 传统的SSH架构,分为三层架构 web控制层、业务逻辑层、数据库访问层。传统架构...

  • MHA高可用

    01,主从复制架构演变介绍 1.基本结构 2.高级应用架构演变 高性能架构 高可用架构 02,高可用架构 1.架构...

  • 2019-05-10MHA高可用技术

    1. 主从复制架构演变介绍 1.2 高级应用架构演变 1.2.1 高性能架构 1.2.2 高可用架构 3. 高...

  • MySQL-MHA高可用技术

    1. 主从复制架构演变介绍 1.1 基本结构 1.2 高级应用架构演变 1.2.1 高性能架构 1.2.2 高可用...

  • MySQL-lesson10-MHA高可用技术

    1. 主从复制架构演变介绍 1.1 基本结构 1.2 高级应用架构演变 1.2.1 高性能架构 1.2.2 高可用...

网友评论

      本文标题:大数据架构演变 (1)

      本文链接:https://www.haomeiwen.com/subject/wnfqaqtx.html