美文网首页大数据学习之路
sparkcore进行wordcount词频统计

sparkcore进行wordcount词频统计

作者: 大数据修行 | 来源:发表于2019-05-20 16:34 被阅读0次

    准备一份数据/home/admin/data/helloworld.txt

    hello   world   hello
    hello   world   welcome
    
    scala> val wc = sc.textFile("file:///home/admin/data/helloworld.txt")
    scala> wc.flatMap(x=>x.split("\t")).map(x=>(x,1)).reduceByKey(_+_).collect()
    res19: Array[(String, Int)] = Array((hello,3), (welcome,1), (world,2))
    

    按照词频排序

    scala> wc.flatMap(x=>x.split("\t")).map(x=>(x,1)).reduceByKey(_+_).sortBy(_._2,true).collect().foreach(println(_))
    (welcome,1)
    (world,2)
    (hello,3)
    

    相关文章

      网友评论

        本文标题:sparkcore进行wordcount词频统计

        本文链接:https://www.haomeiwen.com/subject/dnwkzqtx.html