对话系统概述
-
开放域的对话系统
主要支持闲聊的对话方式,用户通常不具有明确的目的性。在衡量对话的质量上以用户主观体验为主,在实现上主要为基于海量FAQ的检索方式以及端到端的方式。 -
面向任务的对话系统
对话过程通常具有明确的目的性,主要以完成任务为主,实现上分为基于规则和基于数据两种方式。衡量面向任务的对话系统的对话质量时,至少需要知道用户所指定的任务是否被系统正确完成了。
问答系统是单轮对话,面向任务的对话系统是多轮对话。后者需要维护一个用户目标状态的表示,并且依赖于一个决策过程来完成指定的任务,因此问答系统更加关注对话过程,包括目标状态表示和状态迁移,保证目标状态沿着能够完成任务的方向前进。
平时我们所说的SDS(Spoken Dialogue System),默认指的是面向任务的对话系统。
任务对话系统形式化定义
为了方便进一步讲述,接下来对面向任务对话系统的任务进行形式化定义,
符号 | 解释 |
---|---|
用户的对话历史语句 | |
系统的对话历史语句 | |
第n轮的用户对话语句 | |
第n轮的系统对话语句 | |
第n轮的用户动作 | |
第n轮的对话状态 | |
第n轮的系统动作 |
给定前轮的对话历史信息,包括用户的对话历史语句
、系统的对话历史语句及第n轮的用户对话语句,求。
一个典型的对话系统结构
一些关于对话系统(Dialogue System),尤其是面向任务的对话系统(Task-Oriented Dialogue System)的设计、讲解或者论文中,我们经常会看到类似:自然语言理解(NLU)、对话管理(DM)、对话生成(NLG),这样的Pipeline。
图1:一个典型的对话系统结构 A Survey on Dialogue Systems: Recent Advances and New Frontiers [Chen et al., 2014]
一个完整的系统也确实如图所示,是由语言理解、状态跟踪、策略学习、对话生成这些模块组成的。这些模块本质上是为了解决完整的对话系统问题,而拆解出的一个个子模块,这些模块的串联,组成了整个对话系统的Pipeline。
image.png目前主流的任务对话系统实现为模块方式,由于现有训练数据规模的限制,端到端的方式仍处于探索阶段。
程序实现
这里我们用python的类来实现每个部件的接口,其中每个接口最重要的方法是forward,可以认为是一个一个的pipeline直接传递的东西。
例如,我们假设我们构建了各个部件的类:
nlu = NLU()
dst = DST()
dpl = DPL()
nlg = NLG()
# utterence是用户输入的文字
def chatbot_pipeline(utterence):
x = nlu.forward(x)
x = dst.forward(x)
x = dpl.forward(x)
x = nlg.forward(x)
return x # 这里的x已经是系统输出的响应文字了
1. NLU
输入一句用户的自然语言(utterence),输出对应的Domain, Intent, Slots
class NaturalLanguageUnderstanding(object):
def forward(self, utterence:str) -> UserAction:
user_action = UserAction()
# 处理逻辑
return user_action
2. DST
输入一个历史对话状态和NLU的输出,输出一个新的对话状态【对话状态更新模块】
class DialogStateTracker(object):
def forward(self,
init_state: DialogState,
history: List[DialogState],
user_action: UserAction) -> DialogState:
new_ds = DialogState()
return new_ds
DST的主要问题是如何更新当前的对话状态
3. DPL
输入一个当前对话状态,输出一个系统行为【对话策略模块】
class DialogPolicyLearning(object):
def forward(self,
history:List[DialogState]) -> SystemAction:
system_action = SystemAction()
return system_action
4. NLG
输入一个系统行为和参数,输出一个自然语句
class NLG(object):
def forward(self, system_action:SystemAction) -> SystemResponse:
system_response = SystemResponse()
return system_response
网友评论