美文网首页
#学习笔记#章二-大数据处理架构hadoop-中国MOOC厦大

#学习笔记#章二-大数据处理架构hadoop-中国MOOC厦大

作者: LeeMin_Z | 来源:发表于2018-06-08 23:58 被阅读6次

1. hadoop简介:

1.1. hadoop背景与简介

  1. 开源
  2. 运行在linux上且用JAVA编写,有良好的跨平台特性。
  3. 应用可以用多种语言编写。
  4. 可运行在低端机上,构成集群。

1.2. Hadoop应用现状

application.png

1.3. YARN

资源调度,可以用在hadoop,storm,spark上面。

1.4. 怎么选择合适版本?

version.png

学生选一个难装的版本,完全是因为我们穷啊,哈哈哈哈哈哈。心酸,我想用CDH....

2. Hadoop项目结构

str-1.png
str-2.png

3. 安装

这个课程用的是hadoop开源版,我觉得可以用个人版CDH搭起来,会比较简单。

4. Hadoop集群的部署与使用

  1. 分布式节点: 在集群中,大部分的机器设备是作为Datanode和TaskTracker工作的

  2. 主节点: NameNode提供整个HDFS文件系统的NameSpace(命名空间)管理、块管理等所有服务,因此需要更多的RAM,与集群中的数据块数量相对应,并且需要优化RAM的内存通道带宽,采用双通道或三通道以上内存。

  3. 集群规模要多大
    a. 考虑每周存储A,并且有三个HDFS副本,需要额外的3A存储,允许一些中间文件和日志(假定30%A)的空间。--》算两年需要多少机器。
    b. 对于一个小的集群,名称节点(NameNode)和JobTracker运行在单个节点上,通常是可以接受的。
    c. 第二名称节点(SecondaryNameNode)会和名称节点可以运行在相同的机器上,但是,由于第二名称节点和名称节点几乎具有相同的主存需求,因此,二者最好运行在不同节点上

  4. 集群网络拓扑

把hadoop看成服务器,跟路由网络差不多。也需要交换机和路由器进行联通。


一些内心OS:

林子雨老师:你只要在hadoop上敲一些傻瓜指令就可以运行hadoop
我:???????[真的吗.jpg]
林子雨老师:hadoop平台可以做很多东西,但我们不讲,这只是入门级课程
我:额.......求高级篇!

2018.6.9

相关文章

  • #学习笔记#章二-大数据处理架构hadoop-中国MOOC厦大

    1. hadoop简介: 1.1. hadoop背景与简介 开源 运行在linux上且用JAVA编写,有良好的跨平...

  • #学习笔记#章三-分布式文件系统HDFS-厦大MOOC

    3.1.1 计算机集群结构 分布式文件系统,把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群。...

  • Hometown

    中国大学MOOC-大学英语学习笔记,侵删。 Good Morning, everyone! Welcome to ...

  • 重游厦大(二)

    厦大两日游 第二天 依然校园闲逛 方向海边沙滩 所经之处 建筑庄严肃穆 绿茵环绕 静谧祥和 林间小路 不时有小鸟觅...

  • 寻找最棒的自己

    一、行程 1、厦门大学:欣赏了厦大的美丽风景,感受了厦大美好的学习环境,品尝了厦大美味的伙食 2、南普陀寺:并没有...

  • #学习笔记#章五-NoSQL数据库-厦大

    总结:这里讲的是NoSQL数据库的基本原理,重要的特性和类型。NoSQL数据库并没有一种特定的标准,因为目前来说还...

  • 全网牛逼又免费的在线学习平台分享,绝对值得你拥有

    话不多说,直接上在线学习。 1、中国大学MOOC平台 中国大学MOOC(慕课) 是国内优质的中文MOOC学习平台,...

  • 厦大

    一大早,我、妈妈、表姐笑笑和舅妈一起吃完早餐,就去厦大了!(厦大=厦门大学) 厦门大学(Xiamen U...

  • 厦大!

    2018我想去!

  • 厦大

    第一站——厦大 一大早起来,乘车去厦大,公交车费超级便宜,1-2元一票到底,没有分段收费。 之前有听过厦大,据说是...

网友评论

      本文标题:#学习笔记#章二-大数据处理架构hadoop-中国MOOC厦大

      本文链接:https://www.haomeiwen.com/subject/eqyusftx.html