自定义的mapper和reduce类作为两个阶段的任务处理类
mapper类:
setup(); map(); cleanup(); run();
setup是用类似进行map前的一些准备工作;map承担主要的处理工作;cleanup则是收尾工作如关闭文件或者执行map后的k-v分发等;
run提供了setup到map到cleanup的执行模板。
reducer类
reduce; configure; close;
主要使用reduce方法
job类使用
先实例化
Job job = new Job(config);
需要设置job执行作业的输入和输出文件的路径
设置任务处理类
设置输出的key和value的类型
执行job job.waitForCompletion(true);
网友评论