NLP小结

作者: 广义失真 | 来源:发表于2017-09-05 19:19 被阅读15次

    自然语言处理领域主要5中处理技术或处理模型

    分别是:分类、匹配、翻译、结构预测、马尔科夫决策过程。

    这五种处理技术分别可以实现的功能是:

    分配:文本分类、情感分类;

    匹配:搜索、问题回答、对话(主要是单轮对话);

    翻译:机器翻译,语音识别,手写识别,单轮对话;

    结构预测:专门识别,词性标注,句法分析,文本的语义分析,知识图谱构建;

    马可夫决策过程:多轮对话。

    分类:

    文本分类:色情新闻分类、商品自动分类、法律卷宗分类、广告信息分类。

    代表公司:达观数据

    体验1:法狗狗(搜索公众号即可,tab1→智能咨询→劳动机器人)

    体验2:胜利油田中心医院(搜索公众号,tab1→导诊→智能导诊)

    情感分类:暂未找到应用此功能独立公司,应用于聊天机器人中。

    匹配:

    搜索:(作为某种功能集合在其他产品中,暂未发现单独使用的公司)

    问题回答:智能客服,语音助理。代表公司,出门问问,智齿客服

    体验:出门问问APP,翼龙贷微信公众号客服系统,(直接开始对话即可)

    单轮对话:陪伴机器人,个人助手,聊天机器人。体验:出门问问siri

    翻译:

    机器翻译:Google翻译,体验:Google翻译APP

    语音识别:代表,科大讯飞,普强信息,体验:讯飞语音输入法

    手写识别:代表公司,汉王

    单轮对话:执行单论对话,且执行某些人为设定的操作指令。代表,siri,智能家居,行车语音助手等。

    结构预测:

    专门识别:(技术应用于翻译、知识图谱构建、对话、文本分类中)

    词性标注:(技术应用于翻译、知识图谱构建、对话、文本分类中)

    语法分析:(技术应用于翻译、知识图谱构建、对话、文本分类中)

    文本的语义分析:(技术应用于翻译、知识图谱构建、对话、文本分类中)

    知识图谱构建:构建知识图谱,代表:理脉智能

    马可夫决策过程:

    多轮对话:能够理解代表:Amazon echo  Google Assistant  Google Home。

    创业方向分析:

    大体说有三类。

    一类是指令式的,比如智能家居,你下达指令,让它开灯关灯;车载环境下也是指令类。

    第二类是QA类的,基本应用在客服上。##注意事项:大企业会自己做客服系统,借助自身大量的客户积累,去实现问题和回答的匹配。当然有一些中小企业和传统企业,没有这个能力,所以有一些创业公司就切进去了。##注意事项:多轮对话难度非常大。

    第三类:是利用NLP技术对以前积累的数据和知识进行分析和处理,比如文本构成的知识库,像卷宗、病历等等,用Watson这样的系统去分析它,尝试发掘一些规则的知识。

    ##注意事项:通用知识图谱无用户场景,通讯类知识图谱华为等巨头在做。

    企业要求:开始有一个系统,然后有用户产生大量的数据,之后基于数据,开发好的算法,提高系统的性能。如果能够闭环跑起来,就可以去收集更多的数据,可以开发出更好的机器学习算法,使得人工智能系统的性能能够不断提升。这个人工智能闭环是现代人工智能技术范式里最本质的一个现象,对于自然语言处理也不是例外。

    附:当前阶段各项功能准确率

    相关文章

      网友评论

        本文标题:NLP小结

        本文链接:https://www.haomeiwen.com/subject/lbrpjxtx.html