如果关注这个领域的同学可能知道,Ray其实在去年就已经在开源社区正式发布了,只不过后来就一直没有什么太大动静,前段...[作者空间]
什么是元数据?在前面的集成开发环境建设相关文章中,我们也提到过,元数据MetaData狭义的解释是用来描述数据的数...[作者空间]
和90后讨论中年危机?是的,我并没有搞错对象,因为对80后乃至70后的大叔们来说,多数情况下,木已成舟,为时已晚 ...[作者空间]
幸福的家庭都是一样的,不幸的家庭各有各的不幸。- 论一个糟糕的大数据平台工程师的自我修养 本来想写写如何成为一名优...[作者空间]
大数据平台的权限管理工作,听起来不就是用户和密码管理这点事么?找个数据库存储一下两者的映射关系,然后再找个地方记录...[作者空间]
最近有点小忙,更新得慢了,翻出一篇之前没有发在公众号的旧文,凑个数 前排提示一下:下面的内容,是一篇鸡汤文章,本质...[作者空间]
什么是数据同步服务?顾名思义,就是在不同的系统之间同步数据。根据具体业务目的和应用场景的不同,各种数据同步服务框架...[作者空间]
全家桶,要来一份不? 什么是集成开发环境 这一篇,来谈一下大数据开发平台的门面,集成开发环境。什么是集成开发环境?...[作者空间]
日志采集这部分内容,其实在上一篇文章 大数据之路读书笔记 里面多多少少已经提到了一些。不过正如前文提到的,这部分内...[作者空间]
7月份,阿里的数据技术及产品部的同学们出了一本书,大数据之路-阿里巴巴大数据实践,号称全面系统的介绍了阿里巴巴的大...[作者空间]
大数据集群迁移这件事,不知道有多少同学做过。我说的不是把一个集群的数据备份到另一个集群上。我指的是整个数据平台与大...[作者空间]
前面说完了大数据开发平台的核心组件,作业调度系统,接下来讨论一下大数据开发平台的脸面之一,数据可视化平台。和调度系...[作者空间]
上一篇文章,讨论了作业调度系统的分类,流派,架构实现方案和各种方案的优缺点以及适用场景,最后还简单总结了理想中,一...[作者空间]
前面放完建设四个现代化大数据平台乌托邦理想的大卫星,接下来的文章得谈谈具体组件的生产大跃进了。 第一篇,先来讨论一...[作者空间]
Raft这玩意,网上已经有好多解读文章了,大概比Paxos还要多一些,所以,这篇,不求细节,但求核心思想方面,追一...[作者空间]
流式计算框架编程接口的标准化,傻瓜化,SQL化,自打谷歌发表Dataflow编程模型的Paper起,就有走上台面的...[作者空间]
所以,大数据平台的产品化和服务化有什么区别? 服务化的本质思想,是帮用户解决问题,是为人民服务的态度在你的平台中的...[作者空间]
只谈问题,不谈方案,都是耍流氓! 在上一篇《论“跪舔式”构建服务化数据平台的崇高理想》一文中,我耍流氓了,无耻的留...[作者空间]
同志们辛苦了,为人民服务~ 前文我们谈到,在构建数据平台的过程中,我们要坚持四个现代化,这其中平台服务化是关键指导...[作者空间]
Paper阅读系列,主要是一些Paper阅读后,整理的阅读笔记和个人对一些关键思想的理解,方便自己健忘的时候翻出来...[作者空间]