美文网首页
2018-06-13

2018-06-13

作者: LilacZiyun | 来源:发表于2019-06-21 09:36 被阅读0次

情感分析

算法大体步骤见:https://github.com/chaoming0625/FineGrainedOpinionMining

现在大致介绍一下代码:


代码结构

代码结构如上图所示:

code:存放所有的代码

init.py:python 初始化文件,不用管;

common_lib.py:提供项目中常用的方法,如公共文件路径、分词等;

corpus.py:提供语料处理方法,其中GetToTagCorpus用于对原始需要进行人工标记的语料进行处理,输出数据用于人工标记;GetTaggedCorpus对人工标记的数据进行处理,得到用于后续处理的数据,即将人工标记为 E、P、N的数据处理为标记为I-E、B-E、M-E的数据;BootstrappingMaster用于扩充语料;


标签对照表

HMM.py:训练隐马尔可夫模型,得到模型所需的各种概率,并写入数据文件hmm_data中;

main.py:入口程序,analysis_sentence:对句子进行情感判别;first_use_function:首次使用模型时,需要先训练模型,然后再使用模型进行情感分析;not_first_use_function:非首次使用模型时,可以直接用训练好的模型进行情感分析;

pre_process.py:预处理操作

sentiment_analysis.py:句子情感分类

data:存放数据

corpus:语料数据

bootstrapping_corpus.txt:用于采用 bootstrapping 算法扩充预料时的数据集;

train_corpus.txt:训练数据集;

user_dict.txt:用户词典

hmm_data:HMM 模型训练得到的数据

tags:训练得到的标签数据

相关文章

  • 客服部新宙六月第二周周中检视

    2018-06-13 星期三 2018-06-13 一、工作方面 1/本周结案率要求达到55% 目前案件数量225...

  • 2018-06-13

    2018-06-13 2018-06-13 《六项精进》日精进打卡 姓名:张云飞 宁波市百雷仕电动工具有限公司 【...

  • webstorm 激活破解方法

    2018-06-13最新更新:最新License serve:https://s.tuzhihao.com:666...

  • 日精进打卡(第341天)

    2018-06-13 姓名:李义 公司:........ 组别:259期利他二组 【知~学习】 背诵 六项精进大纲...

  • 富贵花开3

    富贵花开 黄土高原的北战 2018-06-13 10:56 · 字数 3634 · 阅读 10 · 日记本 三:《...

  • 2018-06-13

    2018-06-13· 字数 546· 阅读 104· 日记本 姓名:周富强 公司:厦门大科机械有限公司 日精进打...

  • 2019在职MBA考试科目有哪些?什么时候考试?

    2019在职MBA考试科目有哪些?什么时候考试? 都学课堂 2018-06-13 浏览量: 15112 随着社会的...

  • 每日父母课堂分享

    日期 2018-06-13 分享内容 【我们每天都忙碌于具体的事务,真正用来思考的时间其实很少,甚至没有。】 而我...

  • 动机至善,私心了无

    2018-06-13 (稻盛哲学学习会)打卡第66天 姓名:祝新华 部门:业务部 组别:待定 【知~学习】 《京...

  • 2-3-8 SeekBar

    标注:本文为个人整理,仅做自己学习参考使用,请勿转载和转发2018-06-13: 初稿。参考博主coder-pig...

网友评论

      本文标题:2018-06-13

      本文链接:https://www.haomeiwen.com/subject/mjhjeftx.html