美文网首页
Python 练习册 6-找出重要的单词

Python 练习册 6-找出重要的单词

作者: 双核孤城 | 来源:发表于2017-08-09 10:10 被阅读18次

    题目取自Yixiaohan的python练习册

    题目

    你有一个目录,放了你一个月的日记,都是 txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词

    代码

    """
     你有一个目录,放了你一个月的日记,都是txt,为了避免分词的问题,假设内容都是英文,请统计出你认为每篇日记最重要的词。
    """
    from collections import Counter
    
    import os
    
    
    def get_diary_path():
        list = []
        dir_path = './diary'
        for path in os.listdir(dir_path):
            list.append(dir_path + '/' + path)
        return list
    
    
    def get_common_word(paths):
        common_words = []
        for path in paths:
            words = []
            with open(path, 'r') as f:  # 打开文件
                for line in f:
                    line = line.strip('\n')  # 去掉每行后面的换行符
                    if line != '':  # 去掉空行
                        split = str(line).split(' ')
                        words.extend(split)
            common_word = Counter(words).most_common(1)  # 获取此篇中出现频率最高的一个词汇
            common_words.append(common_word)
        return common_words
    
    
    if __name__ == '__main__':
        paths = get_diary_path()
        words = get_common_word(paths)
        print(words)
    

    相关文章

      网友评论

          本文标题:Python 练习册 6-找出重要的单词

          本文链接:https://www.haomeiwen.com/subject/qnsfrxtx.html