美文网首页
企业级Hadoop集群部署注意事项及概念

企业级Hadoop集群部署注意事项及概念

作者: 蓝Renly | 来源:发表于2019-04-27 16:35 被阅读0次

企业级Hadoop集群部署

在网上看了一个挺不错的视频,整理了一下视频中的笔记.

1.节点角色分配

集中式Master,将SPOF单点集中到一起
NameNode,JobTracker/ResourceManager

Hive Metastore, HiveServer2

Impala StateStore, Catalog Server

Spark Master

把这些节点放在一起,方便备份

2.节点内核参数

- ulimit /etc/security/limits.conf  设置nofile
- THP(Transparent Huge Page),ACPI(电源管理,关掉),内存overcommit问题
- 不同功能的节点进行不同的设置
    耗内存?swap(设置)?
    需要高磁盘吞吐?
    CPU,system load高节点

3.HDFS设置

- HDFS block size: dfs.block.size(推荐128M)
-Replication Factor: dfs.replication
-是否开启dfs.permissions,以及fs.permisssions.unmask-mode设置
-用户权限
-DataNode的dfs所在磁盘分区

4.资源分配

-CPU,内存,磁盘IO吞吐,网络吞吐

5.HDFS DataNode磁盘分区设置

HDFS中数据增长的过程可能会导致磁盘空间耗尽,将dfs所在目录单独挂载可避免dfs目录与根目录公用同一个磁盘分区,避免HDFS空间用满时根目录也无法写入文件,严重时可能造成系统 无法登录.
参数:dfs.data.dir

6.Hadoop集群问题

单点问题:

1.0中namenode单点故障,jobtracker单点故障.
2.0中resourceManager单点故障.

7.Impala服务的三个主要守护进程

StateStore Server:用于协调各个运行impalad的实例之间的信息关系,选择集群中一个节点安装.
Catalog Server:用来同步impala中执行的DDL.
impalad(impala daemon):impala的后台进程,需要安装在每一台数据节点上;

8.Yarn中类似MRv1中的JobTracker和TaskTracker两个功能组件的是什么?

ResourceManager和NodeManager
hadoop2.0.PNG hadoop集群要点.PNG hdfs高级运维.PNG hdfs高级运维_NFC配置.PNG hdfs高级运维_各种工具.PNG hive_impala高级应用1.PNG hive0.13持久化UDF.PNG hive0.13新功能.PNG hive中各种设置.PNG hive中各种设置2.PNG hive中各种设置xml.PNG impla设置优化.PNG MR_YARN设置与调优.PNG MR_YARN设置与调优_slot.PNG MR_YARN设置与调优_编码.PNG ozzie设置.PNG ozzie注意事项.PNG 必要工具.PNG 必要工具2.PNG 企业级监控工具.PNG 数据仓库选型.PNG 物流项目1.PNG 重新设置文件副本个数.PNG

相关文章

网友评论

      本文标题:企业级Hadoop集群部署注意事项及概念

      本文链接:https://www.haomeiwen.com/subject/lmmknqtx.html