本文汇总了部分中文自然语言处理中常用的,比较复杂的正则表达式,但并不是都是原创,部分引用了现有的网络资源,特此声明...[作者空间]
早在小学时我们就学过名词、动词、形容词和副词之间的差异。这些“词类”不是闲置的文法家的发明,而是对许多语言处理任务...[作者空间]
本章要点: 中文分词的概念与分类 常用分词的技术介绍 开源中文分词工具-Jieba简介 实战分词之高频词提取 中文...[作者空间]
摘要:这里有改变世界的7大NLP技术,点进来了解一下吧! 什么是NLP? 自然语言处理(NLP)是计算机科学,人工...[作者空间]
交互搜索 交互搜索是一种新的产品形态,可以和用户对话,记住用户的购物需求和偏好,提供购物知识和建议。在搜索页面下拉...[作者空间]
转自 进击的Coder 公众号 原理 中文分词,即 Chinese Word Segmentation,即将一个汉...[作者空间]
简介 实现任何程度或者级别的人工智能所必需的最大突破之一就是拥有可以处理文本数据的机器。值得庆幸的是,全世界文本数...[作者空间]
模型:gensim工具包TF-IDF模型 维基百科语料数据(30万词条)+百度百科(500万) 利用jieba分词...[作者空间]
文本关键词抽取,是对文本信息进行高度凝练的一种有效手段,通过3-5个词语准确概括文本的主题,帮助读者快速理解文本信...[作者空间]
一、语言模型 链接地址(一)N元语言模型 链接地址(二)语言模型性能评价 链接地址(三)数据平滑 链接地址(四)语...[作者空间]
前言 从人们在互联网上的公开话语中, 可以提取到异常多的信息。在Heuritech,我们使用这些信息来更好地了解...[作者空间]
实体属性关系抽取 针对语料:通用语料 抽取关系:通用实体关系 抽取级别:句子级别 关系类型(通用文本) 关系类型(...[作者空间]
万夫一力,天下无敌。------刘基(明) 要说无敌,在目前的文本分类中,支持向量机的分类算法就算是无敌了。那什么...[作者空间]
汉语是世界上最难学的语言! 有人说汉语难学难懂,那么对中文文本的分析也就相对于英文文本来说,更加困难!在学习的过程...[作者空间]
无论什么东西,最好的只有一种------古龙 在目前能看到的文本分类技术中,最好的毋庸置疑就是支持向量机-----...[作者空间]
这是全栈数据工程师养成攻略系列教程的第十七期:17 NLP 使用jieba分词处理文本。 我们对NLP是什么和做什...[作者空间]
教育一直以来都是各方相争得热点,最近整合了一个python库开发了一个作文自动批阅小应用,前端支持微信交互操作和w...[作者空间]
本篇文章是阅读实验楼Foerc的“python基于共现提取《釜山行》人物关系”的总结。如果大家对于绚丽的网络关系节...[作者空间]
常用操作 Part-Of-Speech Tagging and POS TaggerPOS主要是用于标注词在文本中...[作者空间]