大数据04-Hadoop 基础

作者: breezedancer | 来源:发表于2018-09-16 10:50 被阅读4次

下载hadoop-2.7.5进行演示

1、解压

2、配置

配置文件在$HADOOP_HOME/etc/hadoop/目录下

hadoop-env.sh
修改他的 JAVA_HOME

core-site.xml
配置默认文件系统和临时目录

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://localhost:8020</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/app/hadoop-2.7.5/data</value>
</property>

hdfs-site.xml
配置副本数

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

vim slaves
修改域名

namenode 格式化

在$HADOOP_HOME/bin 目录下

./hdfs namenode -format
namenode 格式化成功

启动 Hadoop

在 $HADOOP_HOME/sbin 目录

先启动 hdfs

./start-dfs.sh

之后一路 yes 加上 Linux 的密码

使用 jps查看下

dfs 启动

可以看到 NameNode 、DataNode和SecondaryNameNode 都成功启动了

浏览器输入 http://192.168.31.122:50070/,可以看到

image

搭建 Yarn

进入$HADOOP/etc/hadoop/目录
拷贝一份mapred-site.xml进行配置

 cp mapred-site.xml.template mapred-site.xml

配置 yarn 作为 MapReduce 的调度框架

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

配置vim yarn-site.xml

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>

启动 yarn,进入$HADOOP_HOME/sbin/目录

./start-yarn.sh
查看启动 yarn

可以浏览器打开 http://192.168.31.122:8088

image

测试

测试 HDFS

测试 yarn
进入目录 $HADOOP_HOME/share/hadoop/mapreduce

image
执行
hadoop jar hadoop-mapreduce-examples-2.7.5.jar pi 2 3

可以同时浏览http://192.168.31.122:8088/cluster

image
image

到此为止 Hadoop 环境基本成功

相关文章

  • 大数据04-Hadoop 基础

    下载hadoop-2.7.5进行演示 1、解压 2、配置 配置文件在$HADOOP_HOME/etc/hadoop...

  • java

    数据类型分为:8大基础数据类型和3大引用数据类型。 基础数据类型和引用数据类型的区别: 1,基本数据类型变量声明之...

  • #凉皮增长社#数据分析第一课

    数据分析分为4大板块,分别是基础数据、互动指标、用户沉淀指标,高价值指标。 基础数据基础指标分为6类:广告总展...

  • 大数据敲门砖,想入行大数据必须学习这些知识

    基础概念 大数据的本质 一、数据的存储:分布式文件系统(分布式存储) 二、数据的计算:分部署计算 基础知识 学习大...

  • 缺陷分析笔记

    缺陷分析的基础是数据质量,该如何保证数据质量? 高质量的数据,是缺陷分析的基础,可以从两个方面大的方面来保证数据质...

  • 自己开发小程序,有了这些免费的无次数限制API 接口,再也不愁没

    聚合数据提供30大类,100种以上基础数据API服务,国内最大的基础数据API服务,下面就罗列一些免费的各类API...

  • 数据结构, 算法, 设计模式资料

    资料 实践, 阅读, 思考并行 资料数据结构, 算法设计模式 数据结构, 算法 计算机科学的基础 零基础学算法 大...

  • 【Vue】组件

    Vue的两大核心 数据驱动 - 数据驱动界面显示 模块化 - 复用公共模块,组件实现模块化提供基础 组件基础 组件...

  • Java的数据类型

    Java的数据类型包含基础数据类型、引用数据类型两大类。 一、四大类八个基础数据类型 Java语言提供了八种基本类...

  • [Java基础]包装类型

    [Java基础]包装类 了解一下 什么是包装类型在 Java 中, 数据类型总共可以分为2大类 : 基础数据类型和...

网友评论

    本文标题:大数据04-Hadoop 基础

    本文链接:https://www.haomeiwen.com/subject/npbxnftx.html