美文网首页
MaxCompute MR开发基础

MaxCompute MR开发基础

作者: etheon | 来源:发表于2020-02-02 16:02 被阅读0次

    学习目标

    1.理解MapReduce计算框架基本思想
    2.理解MaxCompute MR原理和关键步骤
    3.了解MaxCompute MR Java SDK接口
    4.了解MaxCompute MR 开发过程


    什么是MR

    • 映射 Mapping
    • 化简 Reduce

    什么是MaxCompute MR

    MaxCompute MR框架

    1.输入数据
    2.Map阶段
    3.Shuffle阶段
    4.Reduce阶段
    5.输出结果


    MaxCompute MR SDK 核心接口

    MaxCompute MR执行流程

    1.提交任务
    2.轮询任务状态
    3.获取任务结束信息

    核心接口

    • MapperBase
    • ReduceBase
    • TaskContext
    • JobClient
    • RunningJob
    • JobConf

    MaxCompute MR的开发及调优

    MR的开发应用流程

    1.安装配置环境
    2.开发MR程序
    3.本地模式测试脚本
    4.导出Jar包
    5.上传至MaxCompute项目空间
    6.在MaxCompute中使用MR

    MR的优化

    • 控制并发
    • 提升个体
    • 优化交互

    相关文章

      网友评论

          本文标题:MaxCompute MR开发基础

          本文链接:https://www.haomeiwen.com/subject/nvjqxhtx.html