笔者写了一篇知识图谱在搜索与推荐中的应用,这篇文章会着重讲讲问答系统中的人机交互和自然语言处理相关的问题。简单聊聊人机交互,目前人机交互的常见场景有如下三种:闲聊型(Chatbot)、问答型(QA)、任务型(VPA)。
闲聊型,典型的应用案例是微软小冰,你可以和小冰进行闲聊
问答型,典型的应用案例是度秘、小蚂答,基于问答的方式与用户进行交互
任务型,cortana和siri应该可以算这个类型的
本文主要着重讲解知识图谱在问答型产品中的应用。
我偏笑_NSNirvana 在QA问句解析的七种方法及优化思路中谈到了几种QA的方案
根据笔者研究,目前问答系统,特别是封闭式的问答系统中,商业化公司一般会偏向两类方案:1.基于模板匹配的方案 2.基于知识图谱的方案
两种方案都有各自的优势。
模板匹配方案项目容易启动,并且能够很快速的解决基础核心问题,但是由于结构问题,不能很好的理解上下文,还有意图模糊的问题。该方法最大的风险因素在人这一块,因为构建规则库到后期成本会越来越高,而且冲突会越来越多,总体来说,这是一个很好做,但是上限不高的方案。如果说只需要满足基础的核心QA需求,这种方案是不错的选择,目前采用这种方案的bot:网易七鱼,中国电信客服机器人
知识图谱方案能够更好的理解语言中的抽象部分,更好的去对语言中模糊的部分通过交互来确认信息。在推荐上能够锁定较少,较为精确的推荐结果,在算法上会比较好实现。目前采用这种方案的bot:度秘、阿里小蜜、小蚂答。其中小蜜和小蚂答的构建方案大体类似,由于用户需求的不同,采用了不同的应用方案才造成了产品形态上的差异。度秘的构建方案有别于阿里小蜜。
之前介绍了知识图谱的schema的构建方案,but,那是基于common sense的构建方案,QA系统中的构建方案会有别于common sense的构建方案,常规的common sense知识图谱构建的抽象层一般来说是type,property这一块一般是具体的概念,例如姚明的老婆, 阿里的方案是将property进行抽象化,例如:(找回密码,semantic of,如何找回密码?),通过这些抽象的边,去描述实体之间的关系,然后通过图遍历的方式去构建交互体系。
图1 阿里小蜜下面是百度度秘的意图图谱有关的资料
百度的意图图谱技术。与我之前讲过的实体图谱不同,意图图谱的节点代表一个个意图节点。这些“意图”之间的关系包括需求澄清(disambiguation)、需求细化(depth extension)、需求横向延展(breadth extension )等。在下图所示例子中,当“阿拉斯加”的意思是“阿拉斯加州”时,与之关联的意图是城市、旅游等信息。当“阿拉斯加”的含义是“阿拉斯加犬”时,它延伸的意图是宠物狗、宠物狗护理,以及如何喂食等。
图2 百度的意图图谱这样的意图图谱可用于人机对话系统当中,下面让我们来看一个度秘基于意图图谱的用户引导例子。
图3 金毛有关的问答用户想要查询关于“金毛”的信息,基于意图图谱,度秘提供给用户关于金毛的一般信息;接着进入第二轮,用户点击了“我想要一只金毛”的选项,度秘便可以猜测用户接下来会想要知道“如何喂养一只金毛”、“什么样的人适合养此类犬”等信息,并将这些引导项展现给用户。然后用户点击了“喂养一只金毛容易吗”的选项。对话进行到此轮,用户的需求基本被满足了。
网友评论