flink 问题总结（4）如何读取sequence 文件

作者: ZYvette | 来源:发表于2020-05-11 19:44 被阅读0次

flink 问题总结（4）如何读取sequence 文件
flink 连接 hdfs 读取文件配置
Flink读取HDFS中的xml（一）——读取XML的几种方式
flink 问题总结（5）如何读取Kerberos认证的hado
2021-01-15Apache Flink (文件写入漏洞/文
【Flink on k8s】JConsole 远程监控 Tas
java 判断hdfs文件的文件类型
读取HDFS高可用配置下的文件
Python读取文件
Python基础(35) - With语句的作用

请移步 flink问题总结目录 (不断更新中)

问题: flink1.8 如何读HDFS的sequence 文件？

解决办法：

1.flink lib目录下需要放下,对应版本的jar包

flink-hadoop-compatibility_2.11-1.8.0.jar
flink-shaded-hadoop-2-uber-2.6.5-8.0.jar

pom 文件中需要有对应haoop的jar包
3.代码如下

Job job = Job.getInstance();
FileInputFormat.addInputPath(job, new Path(path));
DataStream<String> dataStream = env.createInput(
                HadoopInputs.createHadoopInput(
                        new SequenceFileInputFormat<IntWritable, Text>(), IntWritable.class, Text.class, job))
                .flatMap(new FlatMapFunction<Tuple2<IntWritable, Text>, String>() {
                    @Override
                    public void flatMap(Tuple2<IntWritable, Text> value, Collector<String> collector) {
                        collector.collect(String.valueOf(value.f1));
                    }
                });

注意：Text转字符串，直接用String.valueOf(value.f1)转换即可，转成字节再转成字符串会有转码问题。

网友评论

本文标题：flink 问题总结（4）如何读取sequence 文件

本文链接：https://www.haomeiwen.com/subject/usepnhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

flink 问题总结（4）如何读取sequence 文件

问题: flink1.8 如何读HDFS的sequence 文件？

解决办法：

相关文章

flink 问题总结（4）如何读取sequence 文件

flink 连接 hdfs 读取文件配置

Flink读取HDFS中的xml（一）——读取XML的几种方式

flink 问题总结（5）如何读取Kerberos认证的hado

2021-01-15Apache Flink (文件写入漏洞/文

【Flink on k8s】JConsole 远程监控 Tas

java 判断hdfs文件的文件类型

读取HDFS高可用配置下的文件

Python读取文件

Python基础(35) - With语句的作用

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读