一、发展历程
从IVR——智能音箱——多模态界面
二、语音界面设计中常用规则
1、命令——控制/对话模式

2、确认策略
(1)三度置信空间:

(2)视觉确认:
在多模态的设计中,屏幕上可以出现可视化的列表。比如我们的语音助手,用户说打开或者关闭语音助手,那么相应的麦克风图标会有消失和出现的动效。
(3)隐形确认:
答案连同原始的问题一起回复,Siri通过视觉上的可视化列表和语言上的隐性确认来回复我的问题。例如我问:世界上最高的山峰是什么?这个时候系统会马上回复:世界上最高的山峰是珠穆朗玛峰。
(4)非语言确认:
非语言的确认方式也就是行动反馈,不需要口头进行确认,例如假如正在创建一个语音控制灯光的系统,当你说打开灯光的时候,灯自然就会打开,此时已经给了你一个反馈,不需要进行语音进行提示了。在纯语音设备或者系统下,可以提供一个行为反馈,例如光效等。
(5)语音打断:
Vui系统在说话的时候,确认用户是否可以打断,现在一般的语音智能听到唤醒词才会停止说话,唤醒词应在本地处理,设备一直处于接收唤醒词的状态。
多模态形式下,一般是不可以打断的,可以用可视化列表,如Siri不可以打断对话。
3、异常情况处理
(1)语音超时

(2)无语音超时

(3)部分语音识别错误

三、未来发展
1、理解上下文语境;2、消除歧义;3、对话管理;4、情感和情绪分析;5、高级自然语言理解;
原文链接:http://api.m.pmcaff.com/article?id=1059152327580800&from=singlemessage&isappinstalled=0
网友评论