spark加载hdfs数据中文乱码

作者: IT_小白 | 来源:发表于2018-11-24 16:16 被阅读0次

spark加载hdfs数据中文乱码
hdfs读取中文乱码
SPARK表存储格式在HDFS性能比较
webview加载中文数据显示乱码
hadoop hdp 阿里云 There are 3 dat
spark stdout中文乱码
Servlet的一些问题
Impala数据加载与查询
spark开发笔记(四、Spark Streaming笔记)
关于mysql中文编码的问题解决方案

解决加载的数据乱码

    object test {
      def main(args: Array[String]): Unit = {
        val inputpath = "path"
        val inputpath = "/input/123"
        val sparkConf: SparkConf = new SparkConf()
              .setMaster("local[2]")
              .setAppName(test .getClass.getSimpleName)
        val sc: SparkContext = new SparkContext(sparkConf)
              //    TODO:解决中文乱码
        val data: RDD[String] = sc.hadoopFile(inputpath, classOf[TextInputFormat], classOf[LongWritable], classOf[Text])
                              .map(pair => {new String(pair._2.getBytes, 0, pair._2.getLength, "GBK")})
        val line: RDD[String] = data.flatMap(_.split("\t"))
        val pari: RDD[(String, Int)] = line.map((_, 1))
        val result: RDD[(String, Int)] = pari.reduceByKey(_+_)
        result.foreach(println)
      }
    }

网友评论

本文标题：spark加载hdfs数据中文乱码

本文链接：https://www.haomeiwen.com/subject/gvlyqqtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

spark加载hdfs数据中文乱码

解决加载的数据乱码

相关文章

spark加载hdfs数据中文乱码

hdfs读取中文乱码

SPARK表存储格式在HDFS性能比较

webview加载中文数据显示乱码

hadoop hdp 阿里云 There are 3 dat

spark stdout中文乱码

Servlet的一些问题

Impala数据加载与查询

spark开发笔记(四、Spark Streaming笔记)

关于mysql中文编码的问题解决方案

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读