9-6

作者: 汪之涛 | 来源:发表于2017-09-06 21:38 被阅读0次

    背景:

    某个论坛的帖子评论分成positive和negative两种,你已经拿到了sample(影评)和label(评价)两个集合,现在你想知道:

    词汇 --- 评价

    之间的关系,即情感倾向词汇。

    这时候很容易想到的方法是:计算某个词汇的positive/negative的比例,就可以知道词汇的情感倾向,而不需要借助情感词典,假设:ratio = positive/negative,很明显ratio是一个以1为中心的评价指标,ratio=1可以将词汇看成中性词汇。如下图抽取影评结果:

    around 1

    而你会发现后期的计算尝尝要求指标以0为中心的,像这样:

    around 0

    这时候怎么办呢,答案就是对数变换!

    相关文章

      网友评论

          本文标题:9-6

          本文链接:https://www.haomeiwen.com/subject/ekavjxtx.html