过去十年引起广泛关注的数据模型是 MapReduce,但 MapReduce 不是一种具有普适性的架构。相反,MapReduce 市场已经转变为 HDFS 市场,并且似乎准备成为关系型 SQL 市场。
最近,HDFS 领域出现了另一个值得讨论的重点,即“数据湖”。HDFS 集群(目前大多数企业已经投资并希望找到对他们有用的东西)的合理使用是作为已摄取的数据文件队列。随着时间的推移,企业将找出哪些值得花精力清理。因此,数据湖同时只是文件的“垃圾抽屉”。
It is hard to imagine that “one size fits all” will ever be the dominant architecture again. 也就是说,历史是不会倒退的。虽然是可能向关系型数据库转型,但是一定是关系型数据库的强化升级,譬如 NewSQL。
不变的
新的基础架构仍然是 parsing/optimizer/executor structure 架构
变的
concurrency control, crash recovery, optimization, data structures and indexing
网友评论