hadoop

作者: 江江江123 | 来源:发表于2018-06-21 13:22 被阅读6次

1 hdfs 文件分布式存储
2 mapreduce 文件分布式计算
3 yarn 分布式调度

hadoop最简集群启动

1.准备：
3台虚拟机 ip1 hostname1 ip 2 hn2 ip3 hn3 以第一台为例,装有解压好jdk,hadoop
2.修改配置文件
2.1配置hosts vi /etc/hosts 把所有机器名和ip写入
2.2配置profile vi /etc/profile jdk and hadoop

export JAVA_HOME=/path/jdk7
export HADOOP_HOME=/path/hadoop
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source /etc/profile

进入hadoop配置
cd /path/hadoop/etc/hadoop
2.3配置hadoop-env.sh
vi hadoop-env.sh /JAVA_HOME 修改java环境变量
2.4配置core-site.xml
vi core-site.xml

<configuration>
        <property>
                <name>fs.defaultFS</name>
                <value>hdfs://ip1:9000</value>
        </property>
        <property>
                <name>hadoop.tmp.dir</name>
                <value>/path/hadoop/tmp</value>
        </property>
</configuration>

2.5配置hdfs-site.xml

<configuration>
        <!-- 指定HDFS副本的数量 -->
       <property>
            <name>dfs.replication</name>
            <value>3</value>
       </property>
       <property>
             <name>dfs.secondary.http.address</name>
             <value>ip1:50090</value>
       </property>
</configuration>

2.6配置mapred-site.xml

<property>
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
</property>

2.7配置yarn-site.xml

<property>
    <name>yarn.resourcemanager.hostname</name>
    <value>ip1</value>
</property>
<property>
    <name>yarn.nodemanager.aux-services</name>
    <value>mapreduce_shuffle</value>
</property>

3.初始化
hdfs namenode -format
4.启动
start-all.sh
5.查看ip1:50070
ip1:8088

注：关闭防火墙

网友评论

我爱编程

本文标题：hadoop

本文链接：https://www.haomeiwen.com/subject/kqtqmxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

hadoop

hadoop最简集群启动

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

我爱编程