之前写mapreduce程序,输出结果总有一些莫名的“\t”,非常苦恼,研究了一下,在这里记录一下自己的理解。
主要说一下五个分隔符(默认均为“\t”):
1.stream.map.input.field.separator
2.stream.map.output.field.separator
3.stream.reduce.input.field.separator
4.stream.reduce.output.field.separator
5.mapred.textoutputformat.separator
这里通过streaming的流程解释一下各分隔符作用的时间以及结果
以上为个人理解,欢迎大佬指正!
网友评论