美文网首页
hdfs读取中文乱码

hdfs读取中文乱码

作者: 蜡笔广志 | 来源:发表于2019-08-02 10:34 被阅读0次

    乱码这个要从两方面来处理,首先是源头,由于HADOOP默认的中文编码是UTF-8,因此最好我们上传的文件的编码格式也设置成UTF-8。

    接着就是下载了
    FSDataInputStream inputStream = hdfsService.open("/xxx/test.txt");

    BufferedReader reader = new BufferedReader(new InputStreamReader(inputStream)); // 解决乱码
    String line = null;
    StringBuffer sb = new StringBuffer();
    while((line = reader.readLine())!=null){
    System.out.println(line);
    sb.append(line);
    }

    如果直接用inputStream.readLine()来读取,就会又乱码情况,需要用InputStreamReader来进行一次转译。

    相关文章

      网友评论

          本文标题:hdfs读取中文乱码

          本文链接:https://www.haomeiwen.com/subject/yfbkdctx.html