hadoop介绍

作者: 霍运浩 | 来源:发表于2019-02-26 13:37 被阅读0次

可大可小

使用大数据

hadoop生态圈或框架平台

高并发 ==多线程

集群 == 分布式多进程把进程分布到不同机器将会涉及网络通信很麻烦

因此 hadoop诞生了

hadoop 数据存储 hdfs

         数据分析 mapreduce  分析模型   

        资源调度 yern

       离线批量处理

        实时流计算  

        迭代内存分析

站内搜索 ==、百度

磁盘阵列

    是由很多价格较便宜的[磁盘](https://baike.baidu.com/item/%E7%A3%81%E7%9B%98)，组合成一个容量巨大的磁盘组，利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术，将数据切割成许多区段，分别存放在各个硬盘上

爬虫 --> 存储 --》分析 --》索引 --查找

image.png

原始方法通过共享文件夹来海量存储
hdfs ------

image.png
mapredue

image.png

map在 datasnode 处理

网友评论

本文标题：hadoop介绍

本文链接：https://www.haomeiwen.com/subject/ymjayqtx.html

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！