「情感极性分析」是对带有感情色彩的主观性文本进行分析、处理、归纳和推理的过程。按照处理文本的类别不同,可分为基于新闻评论的情感分析和基于产品评论的情感分析。其中,前者多用于舆情监控和信息预测,后者可帮助用户了解某一产品在大众心目中的口碑。
目前常见的情感极性分析方法主要是两种:基于情感词典的方法和基于机器学习的方法。而今天我要介绍的是一种最简单的情感分析方法:基于Python的SnowNLP库的情感分析。SnowNLP是python中用来处理文本内容的,可以用来分词、标注、文本情感分析等,情感分析是简单的将文本分为两类,积极和消极。
1、首先从网页上抓取数据,生成text文件。这里,我爬取的是百度贴吧中的食品安全吧。
食品安全吧的text文本2、导入数据进行情感分析,值越接近1为积极,接近0为消极。详细代码如下:
情感分析详细代码 情感分析结果图文末附上SnowNLP库的GitHub学习链接GitHub - isnowfy/snownlp: Python library for processing Chinese text
作者是一个刚入门Python不久的小白,希望和大家一起学习,共同进步,打开神奇的数据世界。
网友评论