美文网首页
Python词频统计

Python词频统计

作者: 妈耶0000 | 来源:发表于2019-07-09 18:43 被阅读0次
    场景: 现在要统计一个文本中的词频,然后按照频率的降序进行排列
    1.第一种方法
    tf = {
          'b':5,
          'c':10,
          'a':15,
          'd':3
          }
    
    >> f = zip(tf.keys(),tf.values())
    <zip at 0xb323148>
    >> f = sorted(f,key = lambda x :x[1],reverse = True)
    [('a', 15), ('c', 10), ('b', 5), ('d', 3)]
    
    >> data = pd.DataFrame(f,columns=['字母','数量'])
      字母  数量
    0  a  15
    1  c  10
    2  b   5
    3  d   3
    
    
    
    
    
    
    
    
    2.第二种方法
    tf = {
          'b':5,
          'c':10,
          'a':15,
          'd':3
          }
    
    >> f = tf.items()
    dict_items([('b',5),('c',10),('a',15),('d',3)])
    
    
    from operator import itemgetter
    
    >> f = sorted(f,key=itemgetter(1),reverse = True)
    [('a', 15), ('c', 10), ('b', 5), ('d', 3)]
    
    >> data = pd.DataFrame(f,columns=['字母','数量'])
      字母  数量
    0  a  15
    1  c  10
    2  b   5
    3  d   3
    
    
    

    相关文章

      网友评论

          本文标题:Python词频统计

          本文链接:https://www.haomeiwen.com/subject/kmyfkctx.html