Python自然语言处理资料库（长期更新，欢迎补充）

作者: Python中文社区 | 来源:发表于2016-09-11 22:37 被阅读2056次

Python自然语言处理资料库（长期更新，欢迎补充）
Python自然语言工具库NLTK快速入门教程1简介
第1章 NLP基础
第十章 Watson自然语言处理
书籍：使用Python和spaCy进行自然语言处理 Natura
Python之gensim自然语言处理库
Python自然语言处理学习笔记
Python自然语言处理——词性标记
Python网络爬虫实战项目代码大全（长期更新，欢迎补充）
从零开始学自然语言处理（一）—— jieba 分词

中文分词工具API

LTP- 语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、高效、精准的自然语言处理技术。经过哈工大社会计算与信息检索研究中心 11 年的持续研发和推广，LTP 已经成为国内外最具影响力的中文处理基础平台。

NLPIR汉语分词系统- 又名ICTCLAS2013，主要功能包括中文分词；词性标注；命名实体识别；用户词典功能；支持GBK编码、UTF8编码、BIG5编码。新增微博分词、新词发现与关键词提取。

结巴中文分词- 支持三种分词模式：精确模式，试图将句子最精确地切开，适合文本分析；全模式，把句子中所有的可以成词的词语都扫描出来,速度非常快，但是不能解决歧义；搜索引擎模式，在精确模式的基础上，对长词再次切分，提高召回率，适合用于搜索引擎分词。支持繁体分词；支持自定义词典。

Boson中文语义开放平台- Boson中文语义开放平台提供使用简单、功能强大、性能可靠的中文自然语言分析云服务。通过自主研发的中文分词、句法分析、语义联想和实体识别技术，结合海量行业语料的不断积累，为企业和广大开发者提供简单、强大、可靠的中文语义分析云端API。

NLPCN- NLPCN是一个非盈利的自然语言处理组织。遵循开放自由的理念，乐于分享，勤于开源，为为数不多的数据处理的开发者提供了一个资源共享,开源项目介绍,开发者展示的平台。

THUCTC- 是由清华大学自然语言处理实验室推出的中文文本分类工具包，能够自动高效地实现用户自定义的文本分类语料的训练、评测、分类功能。文本文类通常包括特征选取、特征降维、分类模型学习三个步骤。

-SnowNLP- 一个用来处理中文文本的库。它是一个python写的类库，可以方便的处理中文文本内容，是受到了TextBlob的启发而写，由于现在大部分的自然语言处理库基本都是针对英文的，于是写了一个方便处理中文的类库，并且和TextBlob不同的是，这里没有用NLTK，所有的算法都是自己实现的，并且自带了一些训练好的字典。

TextGrocery- 简单高效的短文本分类工具，基于 LibLinear 和 Jieba。

----------------------

本项目收录各种Python自然语言处理开源项目，并长期更新，欢迎补充。

更多Python干货欢迎关注：

微信公众号：Python中文社区

知乎专栏：Python中文社区

Python QQ交流群：152745094

--------------------------

微信公众号：Python中文社区

Python QQ交流群：152745094

--------------------------

Python学习资源下载：

Python开发基础教学视频（密码请关注微信公众号“Python中文社区”后回复“视频”二字获取）

Python学习资料PDF电子书大合集（密码请关注微信公众号“Python中文社区”后回复“资料”二字获取）

Python自然语言处理资料库（长期更新，欢迎补充）
中文分词工具API LTP- 语言技术平台(LTP) 提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义...
Python自然语言工具库NLTK快速入门教程1简介
python测试开发项目实战-目录 python工具书籍下载-持续更新什么是自然语言处理？自然语言处理是指通过...
第1章 NLP基础
这是涂铭的书-python自然语言处理实战的笔记，后续章节也会持续更新。代码，数据集资料：Python自然语言处理...
第十章 Watson自然语言处理
欢迎关注微信公众号watson_python，及时获取最新的更新。在Watson的自然语言处理的API目前有效的...
书籍：使用Python和spaCy进行自然语言处理 Natura
使用Python和spaCy进行自然语言处理本书介绍了使用Python的自然语言处理，使用Python领先的自然...
Python之gensim自然语言处理库
Python之gensim自然语言处理库
Python自然语言处理学习笔记
1. 用Python处理自然语言 1.1. 安装nltk nltk是一个基于Python的自然语言处理工具集，主要...
Python自然语言处理——词性标记
标记含义Python自然语言处理——词性标记
Python网络爬虫实战项目代码大全（长期更新，欢迎补充）
WechatSogou[1]- 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口，可以扩展成基于搜狗搜索的爬虫...
从零开始学自然语言处理（一）—— jieba 分词
作者：Allen欢迎关注我们的公众号：数据科学杂谈今天，我们正式开始《从零开始学自然语言处理》系列文章的更新。内...

Python自然语言处理资料库（长期更新，欢迎补充）

相关文章

Python自然语言处理资料库（长期更新，欢迎补充）

Python自然语言工具库NLTK快速入门教程1简介

第1章 NLP基础

第十章 Watson自然语言处理

书籍：使用Python和spaCy进行自然语言处理 Natura

Python之gensim自然语言处理库

Python自然语言处理学习笔记

Python自然语言处理——词性标记

Python网络爬虫实战项目代码大全（长期更新，欢迎补充）

从零开始学自然语言处理（一）—— jieba 分词

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读

文本挖掘

关于搜索，我们聊聊

自然语言处理

Python中文社区

Machine Learning & Recommendation & NLP & DL

人工智能/模式识别/机器学习精华专题

玩转大数据

公众号爬虫