美文网首页
意图识别预处理二

意图识别预处理二

作者: brandon_wang | 来源:发表于2017-09-22 14:57 被阅读56次

上一章,采用CRF++我们可以将一些时间内容替换为T,地点信息替换为PL,人物信息替换为P,金钱替换为M。

比如,我们说:

下午六点以后的英语可还有吗?

上一个月的课是不是收六千快?

你们的英语课程好有趣啊!

就可以替换成

T以后的C还有吗?

上T的课是不是收M?

除此以外,我们还要注意一种情况,就是同义词情况。

我们可以自己规定一套标准词。

比如,啥和什么是同义词

咋和怎么是同义词

买和购买是同义词。

如果我们将所有的同义词都在预处理阶段化为标准词可以很大程度提高分类成功率。

比如,我们说:

我想试听一节课,咋操作?需不需要报名?

就可以替换为我想试听一节课,怎么操作?需不需要报名?

提高班是个啥玩意,咋弄的?

就可以替换为提高班是个什么玩意,怎么做的?

具体的实现也很多种方法:

可以直接调用现有的同义词典库接口,也可以在自己的库里,通过w2c将同义词替换。

将这一节和上一节总结下就是,意图识别的第一步,我们需要事先清洗数据。

我想报名听一节英语提高班的课,咋弄,一个月收多少,500?

就可以翻译为:

我想报名听一节C提高班的课,怎么弄,T收多少,M?

相关文章

  • 意图识别预处理二

    上一章,采用CRF++我们可以将一些时间内容替换为T,地点信息替换为PL,人物信息替换为P,金钱替换为M。 比如,...

  • 意图识别预处理一

    在上一章里面,我讲的是一个意图识别的思路或者说流程,但是并没有给出具体实现方案。 在本章,我们给出一些细节信息。 ...

  • 意图识别

    1.意图识别各种模型比较 2.基于fastText的意图识别框架

  • 意图识别

    1.使用fastText对文本进行分类--小插曲 2.对话系统原理和实践 3.新闻上的文本分类:机器学习大乱斗

  • Pytext上手——Intent-Slot 模型实战

    1 意图分类任务简介 对话系统里,首先要对用户的输入进行领域、意图识别和槽抽取。深度学习发展以后,意图识别的方法多...

  • SwiftOCR在手机号/数字识别App中的应用

    SwiftOCR在手机号/数字识别App中的应用 数字识别的基本过程 在第一,二步图像获取与预处理后 步骤三使用 ...

  • 搜索-意图识别

    outline 近段时间在研究搜索的相关技术,在工作中主要涉及到资讯搜索功能的实现。我们采用了elasticsea...

  • 意图识别思路

    由于要做一个对话系统,必然要涉及到意图识别模块,所以想梳理一个意图识别的思路: 由于本人做的是一个特定领域的事情,...

  • iOS 预处理->编译->链接

    预处理->编译->链接 预处理:分析程序前先处理的语句,它可以识别散布在程序中的特定语句。所有的预处理语句都适用“...

  • 每日一觉

    每时一觉: 如果想理解自己, 从观察识别到自己的意图开始…… 如果想理解别人, 从观察识别到别人的意图开始…… 如...

网友评论

      本文标题:意图识别预处理二

      本文链接:https://www.haomeiwen.com/subject/wurfextx.html