美文网首页
Hadoop大数据部门组织架构

Hadoop大数据部门组织架构

作者: 程序男保姆 | 来源:发表于2020-08-12 15:33 被阅读0次

大数据部门组织架构

  • 平台组

    • Hadoop Flume Kafka Hbase Spark 框架搭建
    • 集群性能测试
    • 集群性能调优
  • 数据仓库组

    • erl工程师 数据清洗
    • hive工程师 数据分析 数据仓库建模
  • 数据挖掘组

    • 算法工程师
    • 推荐系统工程师
    • 用户画像工程师
  • 报表开发组

    • 报表开发组 javaEE开发

hadoop
- common
- hdfs
- yarn
- mapreduce


image.png

name node 是什么?

 sbin/hadoop-daemon.sh  start namenode 
 sbin/hadoop-daemon.sh  start datanode 
  • hdfs有两个核心namenode(一个主节bai点),datanode(多个从du节点),
    datanode主要是存储数据的,
    namenode一是管理文件系统文件的元数据信息(包括文件名称、大小、位置、属性、创建时间、修改时间等等),二是维护文件到块的对应关系和块到节点的对应关系,三是维护用户对文件的操作信息(文件的增删改查)

  • 相当于一个领导者,负责调度 比如你需要存du一个640m的文件 如果按照64m分块,那么namenode就会把这10个块(这里不考虑副本)分配到集群中的datanode上 并记录对于关系 。当你要下载这个文件的时候namenode就知道在那些节点上给你取这些数据了。。。它主要维护两个map 一个是文件到块的对应关系 一个是块到节点的对应关系。

image.png

这些日志分别代表什么?

hadoop-root-datanode-master.log  
hadoop-root-namenode-master.log  
SecurityAuth-root.audit
hadoop-root-datanode-master.out  
hadoop-root-namenode-master.out

集群的配置信息
http://39.102.32.141:50070/dfshealth.html#tab-overview

创建文件目录
bin/hdfs dfs 固定格式
创建目录
bin/hdfs dfs -mkdir -p /user/yuan/input
查看目录
bin/hdfs dfs -ls /
上传本地文件
 bin/hdfs dfs -put input/wc.input /user/yuan/input

使用hdfs文件系统执行wordcount
 hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar wordcount /user/yuan/input /user/yuan/ouput

查看执行后的文件
bin/hdfs dfs -cat /user/yuan/ouput/p*


bin 脚本
etc 配置文件
include
lib
libexec
sbin 停止启动集群
share 说明文档 案例

相关文章

  • Hadoop大数据部门组织架构

    大数据部门组织架构 平台组Hadoop Flume Kafka Hbase Spark 框架搭建集群性能测试集群性...

  • 华一笔记6

    组织架构设计需要考虑的四大影响因素:战略,规模,环境,技术 组织架构设计的基本任务 岗位设计,部门设计,组织架构类...

  • Hadoop基本知识点总结

    内容参考链接:慕课网--Hadoop大数据平台架构基础篇Google大数据技术(3大):MapReduce、Big...

  • Hadoop学习-基础篇

    Hadoop 大数据平台与架构 功能与优势 Hadoop是大数据存储与分析的架构,是分布式存储和分布式计算平台 两...

  • Hadoop应用架构

    《Hadoop应用架构》这本书就使用Apache Hadoop端到端数据管理方案提供专业架构指导。其他书籍大多针对...

  • 大数据基础概念

    1、什么是大数据? 2、Hadoop是什么? 3、Hadoop核心 4、HDFS总结 5、Hadoop基础架构 H...

  • 初识Hive和Hadoop 2020-04-11

    Hive数据仓库 -- 基于Hadoop(一个分布式系统架构) -- HDFS(Hadoop Distribute...

  • 组织架构及部门职责

    部门职责 总经办: (一)部门职责 (1) 审核公司组织机构调整和重大管理制度改革方案,提交常务部审核、审批。 (...

  • Hadoop大数据平台架构与实践 | hadoop概述与安装

    e> Hadoop大数据平台架构与实践--基础篇 目录 内容概要Hadoop前生Hadoop的功能与优势Hadoo...

  • 大数据开发必读书目(持续更新)

    1.Hadoop Hadoop大数据开发案例教程与项目实战.pdf Hadoop技术内幕 深入解析YARN架构设计...

网友评论

      本文标题:Hadoop大数据部门组织架构

      本文链接:https://www.haomeiwen.com/subject/wycydktx.html