美文网首页
中文情感分析

中文情感分析

作者: martingale | 来源:发表于2018-08-22 10:59 被阅读388次

    一.Deep Learning(深度学习)学习笔记整理系列https://blog.csdn.net/zouxy09/article/details/8775360

    二.文本情感分类(一):传统模型
    https://spaces.ac.cn/archives/3360
    传统的基于情感词典的文本情感分类,是对人的记忆和判断思维的最简单的模拟,可以通过以下几个步骤实现基于情感词典的文本情感分类:预处理、分词、训练情感词典、判断,整个过程可以如下图所示。

    image.png
    1.文本的预处理
    2.句子自动分词
    结巴中文分词、中科院分词、smallseg、Yaha 分词
    3.载入情感词典
    词典是文本挖掘最核心的部分,对于文本感情分类也不例外。情感词典分为四个部分:积极情感词典、消极情感词典、否定词典以及程度副词词典。
    image.png
    加入了某些行业词汇,以增加分类中的命中率。不同行业某些词语的词频会有比较大的差别,而这些词有可能是情感分类的关键词之一。比如,薛云老师提供的评论数据是有关蒙牛牛奶的,也就是饮食行业的;而在饮食行业中,“吃”和“喝”这两个词出现的频率会相当高,而且通常是对饮食的正面评价
    4.文本情感分类
    image.png
    优化思路:
    1.非线性特征的引入
    所谓非线性,指的是词语之间的相互组合形成新的语义。我们将积极词语和消极词语相邻的情况,视为一个组合的消极语块,赋予它负的权值
    2.情感词典的自动扩充
    结论:
    (1)基于情感词典的文本情感分类是容易实现的,其核心之处在于情感词典的训练。
    (2)语言系统是相当复杂的,基于情感词典的文本情感分类只是一个线性的模型,其性能是有限的。
    (3)在文本情感分类中适当地引入非线性特征,能够有效地提高模型的准确率。
    (4)引入扩充词典的无监督学习机制,可以有效地发现新的情感词,保证模型的强健性和时效性。

    相关文章

      网友评论

          本文标题:中文情感分析

          本文链接:https://www.haomeiwen.com/subject/ylskyftx.html