美文网首页
关键字提取

关键字提取

作者: 蓝色滑行 | 来源:发表于2018-11-03 10:03 被阅读0次

关键词提取

import pandas as pd
import jieba.analyse #导入关键词库

读取文本

fn = open('d:/collect.txt',encoding='UTF-8')
string_data = fn.read()
fn.close()

关键词提取

"TF-IDF(term frequency-inverse document frequency)是一种针对关键字的统计分析方法,用来评估关键字或词语
对于文档、语料库和文件集合的重要程度。关键字的重要程度和它在文档中出现的次数成正比,同时跟它出现的频率
呈反比。使用TF-IDF做词频统计的基本思路和方法,也是做词语向量化,以及基于文本向量的聚类、分类等应用方法。"

tags_pairs = jieba.analyse.extract_tags(string_data, topK=5, withWeight=True, allowPOS=['ns', 'n', 'vn', 'v', 'nr'],
withFlag=True) # 提取关键字标签
tags_list = [] # 空列表用来存储拆分后的三个值
for i in tags_pairs: # 打印标签、分组和TF-IDF权重
tags_list.append((i[0].word, i[0].flag, i[1])) # 拆分三个字段值
tags_pd = pd.DataFrame(tags_list, columns=['word', 'flag', 'weight']) # 创建数据框
print (tags_pd) # 打印数据框

相关文章

  • D13+10小鲫鱼+口诀记忆

    适合场景:信息熟悉+重复 如何做:提取关键字+编口诀 关键字提取:首字、压缩信息、借鉴事例 具体事例:与中国接壤1...

  • 关键字提取

    关键词提取 import pandas as pdimport jieba.analyse #导入关键词库 读取文...

  • 【文魁大脑实用记忆第四期】付春蕾 第三次

    案例一:提高教师综合素质 解析:提取关键字,绘制思维导图。 案例二:素质教育与应试教育的区别 解析:提取关键字转化...

  • 關鍵字提煉

    制作教材的时候,关键字提取的成功与否,是影响教材成败的很大的关键。因此平常要多练习关键字的提取,学着用2到4个字,...

  • 从爬取的文章 HTML 中提取出中文关键字

    分2步。 1.从 HTML 中提取出纯文本(去掉标签) 2.从纯文本中提取出中文关键字(TextRank关键词提取...

  • 文本关键字提取

    TF-IDF 是一种数值统计,用于反映一个词对于语料中某篇文档的重要性。某一特定文件内的高频率词语,以及该词语在整...

  • 文章写法

    关键字提取法 https://www.douban.com/doubanapp/dispatch?uri=/rev...

  • Mysql性能优化-5.索引

    1.索引是什么? 索引,index。关键字与数据位置映射关系,称之为索引。关键字:从数据中提取,用于标识,检索数据...

  • python自动化处理logcat日志信息

    1.自动化导出logcat 关键字文本: 提取logcat中一个或者多个关键字。 2.自动化处理logcat时间点...

  • 周记导图第六期研习营郭儿作业No.6《关键词提炼》

    学员,郭儿 组名,神画 解读 中心图是化学实验中蒸馏的图像,代表着,一步一步的提取到关键成分。和我们提取关键字有异...

网友评论

      本文标题:关键字提取

      本文链接:https://www.haomeiwen.com/subject/jpfkxqtx.html