前言
大数据是当前最为流行的热点概念之-,其已由技术名词衍生到对很多行业产生颠覆性影响的社会现象,作为最明确的技术发展趋势之一,基于大数据的各种新型产品必将会对每个人的日常生活产生日益重要的影响。
本书从架构与算法角度全面梳理了大数据存储与处理的相关技术。
今天把这本书的大纲目录整理出来,希望大家会喜欢。
第一篇 大数据基础理论
第1章 数据分片与路由
1.1 抽象模型
1.2 哈希分片( Hash Partition )
1.3 范围分片( Range Partition )
第2章 数据复制与一致性
2.1 基本原则与设计理念
2.2 致性模型分类
2.3 副本更新策略
2.4 一致性协议
第3章 大数据常用的算法与数据结构
3.1 布隆过滤器 ( Bloom Filter )
3.2 SkipList
3.3 LSM树
3.4 Merkle哈希树( Merkle Hash Tree )
3.5 Snappy与LZSS算法
3.6 Cuckoo哈希( Cuckoo Hashing )
第二篇 大数据系统体系结构
第4章 集群资源管理与调度
4.1资源管理 抽象模型
4.2 调度系统设计的基本问题
4.3 资源管理 与调度系统范型
4.4 资源调度策略
4.5 Mesos
4.6 YARN
第5章 分布式协调系统
5.1 Chubby 锁服务
5.2 ZooKeeper
第6章 分布式通信
6.1 序列化与远程过程调用框架
6.2 消息队列
6.3 应用层多播通信 ( Application-L evel Multi-Broadcast )
第7章 数据通道
7.1 Log数据收集
7.2 数据总线
7.3 数据导入/导出
第三篇 大数据存储
第8章 分布式文件系统
第9章 内存KV数据库
第10章 列式数据库
第四篇 大数据处理
第11章 大规模批处理系统
第12章 流式计算
第13章 交互式数据分析
第14章 图数据库:架构与算法
第15章 机器学习:范型与架构.
第17章 增量计算
附录A 硬件体系结构及常用性能指标
附录B 大数据必读文献
今天小编就整理到这里,想要获取的小伙伴可以+wx17667506182来获取哦~~~备注简书。
网友评论