hadoop
一个开源框架,它允许在整个集群使用简单编程模型计算机的分布式环境存储并处理大数据。它的目的是从单一到多扩展,每一个台机都可以提供本地计算和存储。
spark
围绕速度、易用性和复杂分析构建的大数据处理框架。提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的大数据处理的需求
kafka
是一个分布式、分区的、多副本的、多订阅者,基于zookeeper协调的分布式日志系统(也可以当做MQ系统)
hbase
一个分布式的、面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文“Bigtable:一个结构化数据的分布式存储系统”
除了以上内容还有更多资料,视频分享给想要学习的朋友,希望能帮到大家。
关注 转发文章;++我威欣 bmaaa01 。快来领取吧。
网友评论