美文网首页
Java 读取HDFS上的Lzo格式文件

Java 读取HDFS上的Lzo格式文件

作者: BIGrey | 来源:发表于2016-10-25 20:47 被阅读0次

    pom配置

    <dependency>    
        <groupId>org.anarres.lzo</groupId>    
        <artifactId>lzo-hadoop</artifactId>    
        <version>${lzo.version}</version>
    </dependency>
    

    Lzo配置

    Configuration configuration = new Configuration();
    configuration.set("io.compression.codecs", "com.hadoop.compression.lzo.LzoCodec");
    configuration.set("fs.defaultFS","");
    

    Java代码

    LzopCodec lzo = null;
    try {    
        lzo = new LzopCodec();        
        lzo.setConf(HDFSUtils.getLzoDefaultConf()); //为Lzo配置项
        is = lzo.createInputStream(fs.open(lzoFilePath)); // fs为FileSystem对象
        isr = new InputStreamReader(is);    
        reader = new BufferedReader(isr);    
        while ((line = reader.readLine()) != null) {        
            // Process   
        }
    }

    相关文章

      网友评论

          本文标题:Java 读取HDFS上的Lzo格式文件

          本文链接:https://www.haomeiwen.com/subject/mdtduttx.html