驾车导航场景的语音对话设计

作者: 张昕sunny | 来源:发表于2018-05-27 16:17 被阅读0次

本文原创哦~从业产品经理四年多，第一篇长文~

很幸运，作为一名互联网的产品同学（尤其还是从事地图导航这个传统领域的地图导航同学），最近一年推进了百度地图导航场景下小度语音唤醒语音对话的项目，很棒诶，从此步入 AI 产品~

做了一年多了，看了很多其他优秀的产品的分享，自己也有些心得吧，分享一下喽~（呀，要开启我从业产品经理四年多的第一篇长文拉，先给自己点个赞，写的不好，请见谅拉）

第一、语音和驾车场景的特征

先说说语音呀，这是一种如此自然的交互方式嘛~

说话，是很自然的交互方式，用说话代替触屏去下发命令

收听，用耳朵获取信息，用听觉代替视觉获取信息

大家每天的生活中都要说上 N N N多句话吧，语音这么自然的交互方式，真的是要尽快加入服务用户的脚步，随着科技的进步快快融入到我们的生活中来~

再说说驾车场景拉，如果开车的你，一定会有同感的~

驾车场景，双手被占用，双眼目视前方，语音这时候是不是可以来参与一下，帮助司机安全驾驶~

地图导航有很多功能，如退出导航、各种设置项等，入口较深--是不是语音可以代替操作一下呢，就像说小爱同学，"关灯"一样，不用我们去操作。

驾车导航，衣食住行中的行，基本每天都要出门吧，真的是生活中不可缺少的一个场景。

以上呢，语音 X 驾车场景，如果可以结合，相信一定可以碰撞的出火花，记得国外有个用户调研，驾车场景相比客厅等都更值得引入语音交互呢~ 有诉求就有市场拉~

第二，语音X驾车场景结合可以怎么样

那么我们希望呢，语音和驾车场景的结合，可以解决如下问题，看这个图吧：

第三、再来讲讲驾车场景下，功能层面怎么做，我们要提供哪些服务给用户

恩，这个 topic，先来看一张大图：

是不是有点多，哈哈，可以对比下 siri 有多少能力，百度地图场景下的语音交互的能力多少也是可以相比的吧，嘿嘿~

做需求期间，我们通过调研、听取线上音频等途径将驾车场景下，用户可能会存在的诉求做了梳理与归类，主要是四个方向：

道路信息

代替操作

驾车中的高级诉求

其他驾车信息

我们还没有完全支持以上功能呢，还在一直在尽最大可能的覆盖用户的诉求ING~

这里想特别说一下，作为一枚产品经理，选择做什么事情，比这件事情做成多好多细致，要更为重要，尤其是针对 AI 产品，我们需要去解决的是，0分到60分的问题~ 所以，功能建设的这个环节就不多说了，下文会拿个例子来展开介绍一个点，功能分类还是看上面的图就好了。

以及我们不是一次性上线的这么多的能力，我们项目大体上，可以分为三个阶段吧：

第一阶段，尝试期吧，那个版本就支持个位数的功能~ （功能覆盖层面，从0分到20分吧）

第二阶段，完整的诉求搭建期，那个阶段我们投入了比较大量的人力，规划了相对较完整的功能（功能覆盖层面，从20分到70分吧）

第三阶段，持续迭代期，我们一直还在持续的优化、迭代驾车场景下的功能。（功能覆盖层面，70分+吧）

第四，举个例子来分享一下

我想介绍的功能是，驾车场景下用户说"导航去五道口"、"我要天安门" 这个功能。

介绍这个功能之前，先讲一下语音场景下的一般诉求，比如你想知道还要开多久、前方怎么走、或者前方堵不堵，这一类的诉求基本都可以通过"一问一答"来完成，用户一句话就可以解决的事情~ 一句话的事，很方便嘛，希望慢慢的可以有越来越多的用户一句话来获取信息。

那么，驾车场景下，还会有一个很常见的诉求，就是用户想去哪里这个诉求，我们想想，如果用户说的是"去加油站"、"我要去天安门"、"导航去海底捞\肯德基"、"我要去超市\我要去银行\我要去取钱，甚至我要去上班，我要回家"等等。

这种情况下，如果一问一答，显而易见是不能满足用户诉求的，如果是精确的地点，可以为用户直跳，那如果是不确定的地方，这就需要引入多轮了，要承接上下文信息，要根据用户的诉求点去获取目的地，进而引导用户做选择。

而且这个场景很多，用户是要去哪里可以拆分的很细，看下面的图吧，很清晰拉。

第五，想分享一下做语音交互需求中的一点点小心得

1、语音交互期间，听觉上一定要有问有答，要给用户完整的语音反馈

三个小点吧：

保证完整闭环，尤其现在VUI、GUI 交叉的情况下，用户用语音发起的语音交互场景，即使多轮中用户做了手动选择也要有语音反馈。

没听懂，也要告知用户，比如说 '不好意思"，或者"我没听懂"等，不要什么都不说，不要让用户一直等着。

重视异常场景下的用户反馈（尤其是异步请求），要明确告知用户异常，比如说现在没有网络等

2、要学会正确的发问

我们都知道进入多轮的场景，就会识别率的损失，拿在进入多轮让用户做选择的时候，建议产品经理设计问答说辞时可以带一点倾向的引导，比如引导用户说多一些文字，这样可以在识别的时候有助于提升识别率。

比如下面两组，b 就会略好一些

•（a）是否切换？ PK （b）需要切换吗？

•（a）是否添加途经点？ PK （b）需要途经这里吗？

以及大家估计都会有点选择犹豫症，二轮场景一般也都会设计超时机制，建议在让用户选择的时候，有一点指引性，帮助用户在短时间内做出选择。

比如下面这两个句式，b 也要好一点，会让用户可以快速短时间做选择。

•（a）找到3个海底捞，您要去哪里？ PK （b）找到3个海底捞，您要去第几个？

3、重视用户教育及引导

推进需求期间，一直觉得两个是最难的，一是让用户知道我们的这个功能，二是用户语音唤醒后，让用户知道我们有什么能力，这里也分享两点引导层面的心得

•一轮识别失败：告知用户下次可以说什么，提高识别率

比如，驾车场景下，我们会在识别失败后，告诉用户说，"小度没听懂，下次试试说 blabla'，希望借以场景推广我们的功能啦

•二轮识别失败：引导用户说四个字，如确认切换

怎么说，语音识别技术并没有那么尽善尽美，会存在识别不好的情况，尤其是在用户仅说了一两个词的情况下，所以尽可能的在二轮识别失败的情况下，告诉用户说，"不好意思，下次说确认切换，我会识别的更好"

4、也是讲多轮，如何提高多轮识别率

多轮嘛，一般是让用户选择，这一轮用户往往说的话，一般也不如一轮那么多。

语音识别在识别，一个字、两个字的场景下会没那么准确，尤其带口语的话识别率比较差，这种情况下就需要强纠错，来提高识别率。

比如说，我们在跟进线上效果的时候，我们看到用户说"切换"，可能会由于各种原因，识别为吃饭、结婚等，这种情况下可以考虑针对二轮场景的强纠错，进而提升识别率。

好嘞，大周末的花了一些时间，完成了这篇文章，没有说一些语音交互上的样式（比如语音交互要自然，像一个人等），太多这样的分享拉。

感觉做项目中一直都是看别人的分享，激发了一点分享给别人的欲望，希望对于看文章的你，能获取你需要的干货，如果你不吝的话，欢迎来点个赞呀，哈哈。

以及以及，也是想给自己在这个项目上的付出画个句号~ 感谢过去一年多的这个项目，让我成长很多，哈哈~

网友评论

本文标题：驾车导航场景的语音对话设计

本文链接：https://www.haomeiwen.com/subject/nzcidftx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

驾车导航场景的语音对话设计

相关文章

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读