自然语言处理库之snowNLP

自然语言处理库之snowNLP

作者: 大邓和他的python | 来源:发表于2017-04-12 23:07 被阅读3555次

自然语言处理库之snowNLP
Python之gensim自然语言处理库
2018-03-08自然语言处理库之snowNLP
自然语言处理之路：工具——七种兵器
jieba分词（R vs. python）
ai 文本挖掘相关
NLP入门之N元语法模型
Snownlp
NLP基本步骤及原理
从苍井空结婚看网络反映

中文自然语言处理

之前看到知乎有一篇《哪些python库让你相见恨晚？》

https://www.zhihu.com/question/24590883

里面有几个中文的库，分别是jieba、snownlp、textgrocery。jieba大家已经很熟悉了，基本上分词都会用到jieba，速度快，分词页挺准的。

我之前页写过对文本进行情绪分析的文章，用建好的词典，通过一个公式计算，得出正负面情绪分值。当时写这篇文章时，不知道其实是有中文情感分析的库。

今天我就简单介绍下snowNLP，可以分词，标注，还可以进行情绪分析。

snowNLP介绍

SnowNLP是一个python写的类库，可以方便的处理中文文本内容，是受到了TextBlob的启发而写的，由于现在大部分的自然语言处理库基本都是针对英文的，于是写了一个方便处理中文的类库，并且和TextBlob不同的是，这里没有用NLTK，所有的算法都是自己实现的，并且自带了一些训练好的字典。注意本程序都是处理的unicode编码，所以使用时请自行decode成unicode。

示例

1、分词

2、词性标注

3、断句

4、情绪判断

返回值为正面情绪的概率，

越接近1表示正面情绪

越接近0表示负面情绪

5、拼音

6、繁体转简体

7、关键词抽取

8、概括总结文意

9、信息量衡量

TF-IDF是一种统计方法，用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。

TF词频越大越重要，但是文中会的“的”，“你”等无意义词频很大，却信息量几乎为0，这种情况导致单纯看词频评价词语重要性是不准确的。因此加入了idf

IDF的主要思想是：如果包含词条t的文档越少，也就是n越小，IDF越大，则说明词条t越重要

TF-IDF综合起来，才能准确的综合的评价一词对文本的重要性。

10、文本相似性

更多内容

爬虫

初识Python的GUI编程

爬虫实战视频专辑

【视频】手把手教你抓美女~

当爬虫遭遇验证码，怎么办

用词云图解读“于欢案”

【视频】于欢案之网民的意见（1）？

【视频】有了selenium，小白也可以自豪的说：“去TMD的抓包、cookie”

【视频】快来get新技能--抓包+cookie,爬微博不再是梦

【视频教程】用python批量抓取简书用户信息

爬豆瓣电影名的小案例（附视频操作）

爬豆瓣电影名的小案例2（附视频操作）

用Python抓取百度地图里的店名，地址和联系方式

文本分析

python居然有情感？？真的吗？？

数说中南大学研究生感情状况及择偶观

用gensim库做文本相似性分析

基于共现发现人物关系的python实现

用python计算两文档相似度

神奇的python

怜香惜玉，我用python帮助办公室文秘

逆天的量化交易分析库-tushare

开扒皮自己微信的秘密

8行代码实现微信聊天机器人

使用Python登录QQ邮箱发送QQ邮件

相关文章

自然语言处理库之snowNLP
中文自然语言处理之前看到知乎有一篇《哪些python库让你相见恨晚？》 https://www.zhihu.co...
Python之gensim自然语言处理库
Python之gensim自然语言处理库
2018-03-08自然语言处理库之snowNLP
转载于https://www.jianshu.com/p/4692d1b5364d[https://www.jia...
自然语言处理之路：工具——七种兵器
自然语言处理之路：工具——七种兵器一个自然语言处理炼丹师的自白往期：自然语言处理之路：前提——英文自然语言处理之...
jieba分词（R vs. python）
自然语言处理（Natural Language Processing）自然语言处理（NLP）是机器学习重要分支之...
ai 文本挖掘相关
python的中文文本挖掘库snownlp进行购物评论文本情感分析实例昨晚上发现了snownlp这个库，很开心。...
NLP入门之N元语法模型
在上边我们知道其实当今的自然语言处理的主流趋势是统计自然语言处理,而统计自然语言处理的基本目的就是结合语料库中的一...
Snownlp
简介 SnowNLP是一个python写的类库，可以方便的处理中文文本内容，是受到了TextBlob的启发而写的，...
NLP基本步骤及原理
本文目录第一章：文本预处理（Preprocess）1.1NLTK自然语言处理库1.1.1 NLTK自带语料库第二章...
从苍井空结婚看网络反映
工具：python 第三方库：SnowNLP、pandas、WordCloud、matplotlib、Beauti...

网友评论

DaydayHoliday:代码能贴成文字就更好了

数据科学

本文标题：自然语言处理库之snowNLP

本文链接：https://www.haomeiwen.com/subject/eievattx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

数据科学

关于我们|服务条款|联系我们|自然语言处理库之snowNLP|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！