作为一个乙方的算法研究员,疲于应付各种项目,每天至少要写几百行脚本,虽然绝大多数都是一次性代码,但是也有少量有复用...[作者空间]
由于最近在做一些无监督的关键词短语(实体)抽取工作,其实最大的背景还是没有标注好的实体识别训练数据;所以想到采用无...[作者空间]
PyTorch最近版本更新很快,1.2/1.3/1.4几乎是连着出,其中:1.3/1.4版本主要是新增并完善了Py...[作者空间]
最近出于兴趣和需要,重新回顾中文分词技术,期间有些心得,以及一些关于自然语言处理的浅薄之见,这里简单分享一下。 首...[作者空间]
今天终于开始技术博客的第一章,从阅读理解的非预训练model开始,第一篇SAN for SQUAD 2.0 阅读理...[作者空间]
如果代码中有if条件控制,尽量避免使用torch.jit.trace来转换代码,因为它不能处理变化条件,如果非要用...[作者空间]
Python已经成为了一门网红语言,很多人都在学,每天都有人在问:我自学了Python,可以转行做程序员吗? 当然...[作者空间]
在做物体检测的时候常常会用到倾斜四边形(一般是矩形)的NMS问题,在允许使用OpenCV的环境下,可以直接调用cv...[作者空间]
纠正单词拼写错误 单词拼写错误的情形 Non-word spelling errors:错误的单词不存在词典中; ...[作者空间]
知识蒸馏(Knowledge Distillation): 知识蒸馏即将知识从「教师」模型迁移到「学生」模型,执行...[作者空间]
发现新词 目的:解决未登陆此; 定义:不加入任何先验素材,直接从大规模的语料库中,自动发现可能成词的语言片段; 影...[作者空间]
本文首发自 easyAI - 人工智能知识库 原文地址:《一文看懂自然语言生成 - NLG(6个实现步骤+3个典型...[作者空间]
朴素贝叶斯算法是NLP领域常用的一种算法模型,这里我们用一个简单的例子来看看怎么样用他来进行一个NLP的分类例子。...[作者空间]
引言 “结巴”分词是一个Python 中文分词组件,参见https://github.com/fxsjy/jieb...[作者空间]
1. 总述 【论文名称】A Neural Attention Model for Abstractive Sent...[作者空间]
Kmeans是一种简单易用的聚类算法,是少有的会出现在深度学习项目中的传统算法,比如人脸搜索项目、物体检测项目(y...[作者空间]
今天我们来谈谈主题模型(Latent Dirichlet Allocation),由于主题模型是生成模型,而我们常...[作者空间]
一、概述 近些时间以来,工作内容总围绕着自然语言生成(NLG)方向展开。近些时间,在NLP(自然语言处理)大热的当...[作者空间]
在Attention Is All You Need-谷歌的"自注意力"中提到了为什么不在NLP中的原因。今天再分...[作者空间]
最近斯坦福的CS224N开课了,看了下课程介绍,去年google发表的Transformer以及最近特别火的Con...[作者空间]