五、语音助手产品-对话产品的设计和实现
这几年人工智能大火,语音助手也不是什么新鲜的概念了,比较有代表性的百度、苹果、谷歌、小米等等都推出了自己的语音助手,那么究竟语音助手是怎么实现的呢,由哪些技术组成呢?在语音语义产品设计的工作和传统产品设计的工作又有没有不同呢。
从用户使用层面来说,语音助手一般由两个模块构成,一个是功能性技能,还有就是兜底类技能。
功能性技能简单的说,就是用户通过语音实现平时手机app上的操作。比如在车载语音助手中,我们用语音来发起导航、听音乐、打电话;在家庭场景用语音进行视频点播,控制一些智能设备,比如灯、空调、洗衣机扫地机器人等等。
那它实际的组成的模块是怎么样的呢
一般对话助手由五个组成部分:语音识别(ASR),自然语言理解(NLU),对话管理(DM),自然语言生成(NLG)和文本到语音合成(TTS)。ASR通过深度学习技术得到了较好的解决。 NLG和TTS容易控制。对话系统设计的难点主要在于NLU和DM,这将在下面的段落中详细讨论。
(图)
语境的概念,dm的概念和组成
网友评论