数据

作者: 淼一科技2008 | 来源:发表于2019-11-01 10:30 被阅读0次

作者:Logo和视频制作

链接:https://zhuanlan.zhihu.com/p/89593870

来源:知乎

著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

大数据技术体系

从概念上讲,上面所说的东西,都是比较笼统的概念,而大数据作为目前已经发展的比较成熟的阶段,已经形成了自己的一整套体系。

总的来说,大数据技术等于“数据”到“用户”这么一个过程。从低到高,共分为六层。

第一层:数据采集

所谓数据采集,就是我首先要有数据分析的素材,我们需要得到这些数据,才能进行有价值的分析对比。比如百度的搜索记录的数据。阿里的用户购物的数据。腾讯的用户聊天数据。都是很好的数据素材。

第二层:数据存储

产生了数据,我们的数据到底该放在哪里?以什么样的方式进行存储?因为这些数据只有保存下来,才能进行有价值的分析,提取,最终得到我们想要的东西。所以数据存储是非常重要的一环。

第三层:资源管理层

有了海量的数据,我们要对数据进行存放,那我们如何保证存放数据能够快速的读取?如何针对不同的业务做不同的分析?为了有效的调度各类资源,我们大数据中,就专门有了资源管理层。

第四层:计算引擎层

我们知道了如何做资源调度,那么就要开始对最原始的数据开始处理,处理方式有实时处理、交互式处理、批处理等等。

实时处理,就是我希望得到用户实时的访问记录、活跃度、实时网页浏览等信息,采集到这样的东西,我们进行生成实时的统计、报表等信息。

交互式分析,就是用户和系统之间进行交互的部分,一般使用类SQL语言便于数据的查询和分析等。

批处理,对时间及时性要求低,一般进行批量数据分析,数据清洗等操作。

第五层:数据分析层

一般是和应用程序对接,把经过批量处理,或者加工过的数据,通过SQL、API等方式暴露出去的过程,就是数据分析。

第六层:数据可视化

为了让用户更加清晰的感知到数据的情况,一般使用可视化的东西呈现到用户面前,可以呈现的是网页、图表、报表等信息。

相关文章

  • 数据,数据

    谁的数据? 是个手机应用就想读取位置信息、通讯录,是个网站就想记录用户的浏览行为,他们保存了很多的数据。可是,这些...

  • 数据数据

    帖子来自:大数据社区|大数据学习交流社区|大数据免费学习资源_大数据巴士 头像 柠檬学院大数据 LV1 2016-...

  • 数据数据

    似懂非懂的好像又悟出来一个道理,居然对重来不愿意进脑袋的“数据”一词有了一面之交的熟悉呢。 自小到大就爱说些别人不...

  • Python Pandas Dataframe 的基本操作

    数据洞察 数据清洗 数据预处理 数据获取 数据筛选 6.数据汇总 数据输出

  • 《Python数据分析与挖掘实战》第四章 数据预处理

    主要包括数据清洗、数据集成、数据变幻和数据规约。 数据清洗 删除原始数据集中的无关数据、重复数据,平滑噪声数据,筛...

  • 基础定义

    一、数据结构 1.1 定义 数据项——>数据元素——>数据对象——>数据 数据对象+结构——>数据结构 数据结构包...

  • pandas手册

    导入数据 导出数据 查看、检查数据 数据选取 数据清理 数据处理:Filter、Sort和GroupBy 数据合并...

  • 2019-07-25

    数据管理 元数据是关于数据的数据 元数据打通了源数据、数据仓库、数据应用,记录了数据从产生到消费的全过程。 元数据...

  • 日志定位

    前后端 前端: 收集数据、数据校验、数据处理、数据解析、数据展现 后端: 数据解析、数据校验、数据处理 日志定位 ...

  • reshape2数据汇总

    dcast:长数据变短数据,数据变形,汇总 长数据 由1式,得到短数据: melt:短数据变长数据 短数据: 由式...

网友评论

      本文标题:数据

      本文链接:https://www.haomeiwen.com/subject/hbhfbctx.html