美文网首页
实训总结20170924

实训总结20170924

作者: 韩志俊 | 来源:发表于2017-09-24 19:13 被阅读0次

                                                                       MapReduce代码

Map过程

IntWritable one = new IntWritable(1);

public void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException{

String []res=value.toString().split("\t");

String url=res[28];

context.write(new Text(url), one);

}

Reduce过程

public void reduce(Text key, Iterable values,

Context context) throws IOException, InterruptedException{

int sum = 0;

for(IntWritable value:values){

sum+=value.get();

}

context.write(new Text(key.toString()+":"+sum),NullWritable.get());

}

job过程

public staticvoid main(String[] args) throws Exception{

Configurationconf =new Configuration();

Jobjob= Job.getInstance(conf,"Pv");

job.setJarByClass(PvUvjob.class);

Pathin=new Path("/user/input/pv");

Pathout=new Path("/user/output/pv");

FileInputFormat.addInputPath(job,in);

FileOutputFormat.setOutputPath(job, out);

job.setInputFormatClass(TextInputFormat.class);

job.setOutputFormatClass(TextOutputFormat.class);

job.setMapperClass(PvUvMap.class);

job.setReducerClass(PvUvReduce.class);

//map输出类型

job.setMapOutputKeyClass(Text.class);

job.setMapOutputValueClass(IntWritable.class);

//reduce输出类型

job.setOutputKeyClass(Text.class);

job.setOutputValueClass(NullWritable.class);

job.setNumReduceTasks(1);

job.waitForCompletion(true);

}

?3�U�ta

相关文章

  • 实训总结20170924

    MapReduce代码 Map过程 IntW...

  • 实训总结

    时光的表盘上,总有一些耀眼的时刻,标注着历史的进程。八周的实训时间转瞬即逝,所谓的期末就在岁末中画上了圆满的句号了...

  • 实训总结

    回顾这两个月实训经历,对学生来说,只是大学课程中一小段,但是对我来说影响深远。在这个过程中有问题也有收获。 在教学...

  • 6.6实训总结

    通过今天一下午的实训,我学到了很多东西,也让我对网络营销有了新的认知,孙振老师也带我们见识了大佬们对网络营销的各种...

  • 实训总结20170923

    数据仓库概述 什么是数据仓库? 创始人W.H.Inmon在《建立数据仓库》一书中对数据仓库的定义是:数据仓库就是面...

  • 实训总结20171103

    SSM Spring:业务层的框架 Spring mvc:开发web应用程序的模块model+view+contr...

  • 实训总结20170917

    hive介绍 基于Hadoop的一个数据仓库工具,构建于hadoop的hdfs和mapred之上,用于管理和查询结...

  • 实训总结20170916

    CREATE TABLE city( province_code INT, province_name strin...

  • 实训总结20171006

    Zookeeper 是一个分布式应用程序提供高性能协调服务的工具集合。 ZooKeeper本质上是一个分布式的小文...

  • 实训总结20171008

    ElasticSearch Redis c++编写代码量小,消耗内存大 SSDB 360的k-v硬盘 fastDF...

网友评论

      本文标题:实训总结20170924

      本文链接:https://www.haomeiwen.com/subject/bxclextx.html