配置hadoop集群

前置准备：

集群之间能够无密码SSH登录
『 Hadoop』从零安装第五弹 - 简书
http://www.jianshu.com/p/c979dbe13537

配置思路：

首先一个有七个文件要修改
hadoop-2.6.0/etc/hadoop/hadoop-env.sh
hadoop-2.6.0/etc/hadoop/yarn-env.sh
hadoop-2.6.0/etc/hadoop/core-site.xml
hadoop-2.6.0/etc/hadoop/hdfs-site.xml
hadoop-2.6.0/etc/hadoop/mapred-site.xml
hadoop-2.6.0/etc/hadoop/yarn-site.xml
hadoop-2.6.0/etc/hadoop/slaves
之后修改/etc/profile设置环境变量，
当在master上修改完成后，将hadoop-2.6.0/etc/hadoop/
连同修改后的配置文件，通过scp拷贝到其它2台机器上，之后测试hadoop配置，成功格式化则说明大功快要告成了*

以下操作在~/software/hadoop/hadoop-2.6.0中！！

hadoop-env.sh
$ vi etc/hadoop/hadoop-env.sh
yarn-env.sh
$ vi etc/hadoop/yarn-env.sh
core-site.xml
$ vi etc/hadoop/core-site.xml
hdfs-site.xml
$ vi etc/hadoop/hdfs-site.xml

*PS：注:dfs.replication表示数据副本数，
一般不大于datanode的节点数(即不大于集群机子数)。
这里为了避免出错，设置为1.

mapred-site.xml
$ vi etc/hadoop/mapred-site.xml
*PS：如果不存在mapred-site.xml
就把mapred-site.xml.template
复制一份为mapred-site.xml

yarn-site.xml
$ vi etc/hadoop/yarn-site.xml

<configuration>

  <property>

  <name>yarn.nodemanager.aux-services</name>

  <value>mapreduce_shuffle</value>

</property>

 <property>

 <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
    <value>org.apache.hadoop.mapred.ShuffleHandler</value>

 </property>

  <property>

  <name>yarn.resourcemanager.scheduler.address</name>

   <value>master:8030</value>
  </property>
  <property>
    <name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8025</value>

  </property>

 <property>

  <name>yarn.resourcemanager.address</name>

 <value>master:8040</value>

</property>

</configuration>

7. slaves

PS：这样只有slave1，slave2上有datanode进程

8. 修改/etc/profile设置环境变量
$ sudo vi /etc/profile

export HADOOP_HOME=/home/sakura/software/hadoop/hadoop-2.6.0

export CLASS=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH:$HADOOP_HOME/share/hadoop/common/hadoop-common-2.6.0.jar:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.6.0.jar:$HADOOP_HOME/share/hadoop/common/lib/commons-cli-1.2.jar

export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin:$PATH

至此，master上hadoop集群配置完成！