美文网首页
驾车导航场景的语音对话设计

驾车导航场景的语音对话设计

作者: 张昕sunny | 来源:发表于2018-05-27 16:17 被阅读0次

    本文原创哦~从业产品经理四年多,第一篇长文~

    很幸运,作为一名互联网的产品同学(尤其还是从事地图导航这个传统领域的地图导航同学),最近一年推进了百度地图导航场景下小度语音唤醒语音对话的项目,很棒诶,从此步入 AI 产品~

    做了一年多了,看了很多其他优秀的产品的分享,自己也有些心得吧,分享一下喽~(呀,要开启我从业产品经理四年多的第一篇长文拉,先给自己点个赞,写的不好,请见谅拉)

    第一、语音 和驾车场景的特征

    先说说语音呀,这是一种如此自然的交互方式嘛~

    说话,是很自然的交互方式,用说话代替触屏去下发命令

    收听,用耳朵获取信息,用听觉代替视觉获取信息

    大家每天的生活中都要说上 N N N多句话吧,语音这么自然的交互方式,真的是要尽快加入服务用户的脚步,随着科技的进步快快融入到我们的生活中来~

    再说说驾车场景拉,如果开车的你,一定会有同感的~

    驾车场景,双手被占用,双眼目视前方,语音这时候是不是可以来参与一下,帮助司机安全驾驶~

    地图导航有很多功能,如退出导航、各种设置项等,入口较深--是不是语音可以代替操作一下呢,就像说小爱同学,"关灯"一样,不用我们去操作。

    驾车导航,衣食住行中的行,基本每天都要出门吧,真的是生活中不可缺少的一个场景。

    以上呢,语音 X 驾车场景 ,如果可以结合,相信一定可以碰撞的出火花,记得国外有个用户调研,驾车场景相比客厅等都更值得引入语音交互呢~ 有诉求就有市场拉~

    第二,语音X驾车场景结合可以怎么样

    那么我们希望呢,语音和驾车场景的结合,可以解决如下问题,看这个图吧:

    第三、再来讲讲驾车场景下,功能层面怎么做,我们要提供哪些服务给用户

    恩,这个 topic,先来看一张大图:

    是不是有点多,哈哈,可以对比下 siri 有多少能力,百度地图场景下的语音交互的能力多少也是可以相比的吧, 嘿嘿~

    做需求期间,我们通过调研、听取线上音频等途径将驾车场景下,用户可能会存在的诉求做了梳理与归类,主要是四个方向:

    道路信息

    代替操作

    驾车中的高级诉求

    其他驾车信息

    我们还没有完全支持以上功能呢,还在一直在尽最大可能的覆盖用户的诉求ING~

    这里想特别说一下,作为一枚产品经理,选择做什么事情,比这件事情做成多好多细致,要更为重要,尤其是针对 AI 产品,我们需要去解决的是,0分到60分的问题~  所以,功能建设的这个环节就不多说了,下文会拿个例子来展开介绍一个点,功能分类还是看上面的图就好了。

    以及我们不是一次性上线的这么多的能力,我们项目大体上,可以分为三个阶段吧:

    第一阶段,尝试期吧,那个版本就支持个位数的功能~ (功能覆盖层面,从0分到20分吧)

    第二阶段,完整的诉求搭建期,那个阶段我们投入了比较大量的人力,规划了相对较完整的功能(功能覆盖层面,从20分到70分吧)

    第三阶段,持续迭代期,我们一直还在持续的优化、迭代驾车场景下的功能。(功能覆盖层面,70分+吧)

    第四,举个例子来分享一下

    我想介绍的功能是,驾车场景下用户说"导航去五道口"、"我要天安门" 这个功能。

    介绍这个功能之前,先讲一下语音场景下的一般诉求,比如你想知道还要开多久、前方怎么走、或者前方堵不堵,这一类的诉求基本都可以通过"一问一答"来完成,用户一句话就可以解决的事情~  一句话的事,很方便嘛,希望慢慢的可以有越来越多的用户一句话来获取信息。

    那么,驾车场景下,还会有一个很常见的诉求,就是用户想去哪里这个诉求,我们想想,如果用户说的是"去加油站"、"我要去天安门"、"导航去海底捞\肯德基"、"我要去超市\我要去银行\我要去取钱,甚至我要去上班,我要回家"等等。

    这种情况下,如果一问一答,显而易见是不能满足用户诉求的,如果是精确的地点,可以为用户直跳,那如果是不确定的地方,这就需要引入多轮了,要承接上下文信息,要根据用户的诉求点去获取目的地,进而引导用户做选择。

    而且这个场景很多,用户是要去哪里可以拆分的很细,看下面的图吧,很清晰拉。

    第五,想分享一下做语音交互需求中的一点点小心得

    1、语音交互期间,听觉上一定要有问有答,要给用户完整的语音反馈

    三个小点吧:

    保证完整闭环,尤其现在VUI、GUI 交叉的情况下,用户用语音发起的语音交互场景,即使多轮中用户做了手动选择也要有语音反馈。

    没听懂,也要告知用户,比如说 '不好意思",或者"我没听懂"等,不要什么都不说,不要让用户一直等着。

    重视异常场景下的用户反馈(尤其是异步请求),要明确告知用户异常,比如说现在没有网络等

    2、要学会正确的发问

    我们都知道进入多轮的场景,就会识别率的损失,拿在进入多轮让用户做选择的时候,建议产品经理设计问答说辞时可以带一点倾向的引导,比如引导用户说多一些文字,这样可以在识别的时候有助于提升识别率。

    比如下面两组,b 就会略好一些

    •(a)是否切换?  PK  (b)需要切换吗?

    •(a)是否添加途经点?  PK  (b)需要途经这里吗?

    以及大家估计都会有点选择犹豫症,二轮场景一般也都会设计超时机制,建议在让用户选择的时候,有一点指引性,帮助用户在短时间内做出选择。

    比如下面这两个句式,b 也要好一点,会让用户可以快速短时间做选择。

    •(a)找到3个海底捞,您要去哪里?  PK  (b)找到3个海底捞,您要去第几个?

    3、重视用户教育及引导

    推进需求期间,一直觉得两个是最难的,一是让用户知道我们的这个功能,二是用户语音唤醒后,让用户知道我们有什么能力,这里也分享两点引导层面的心得

    •一轮识别失败:告知用户下次可以说什么,提高识别率

    比如,驾车场景下,我们会在识别失败后,告诉用户说,"小度没听懂,下次试试说 blabla',希望借以场景推广我们的功能啦

    •二轮识别失败:引导用户说四个字,如确认切换

    怎么说,语音识别技术并没有那么尽善尽美,会存在识别不好的情况,尤其是在用户仅说了一两个词的情况下,所以尽可能的在二轮识别失败的情况下,告诉用户说,"不好意思,下次说确认切换,我会识别的更好"

    4、也是讲多轮,如何提高多轮识别率

    多轮嘛,一般是让用户选择,这一轮用户往往说的话,一般也不如一轮那么多。

    语音识别在识别,一个字、两个字的场景下会没那么准确,尤其带口语的话识别率比较差,这种情况下就需要强纠错,来提高识别率。

    比如说,我们在跟进线上效果的时候,我们看到用户说"切换",可能会由于各种原因,识别为 吃饭、结婚 等,这种情况下可以考虑针对二轮场景的强纠错,进而提升识别率。

    好嘞,大周末的花了一些时间,完成了这篇文章,没有说一些语音交互上的样式(比如语音交互要自然,像一个人等),太多这样的分享拉。

    感觉做项目中一直都是看别人的分享,激发了一点分享给别人的欲望,希望对于看文章的你,能获取你需要的干货,如果你不吝的话,欢迎来点个赞呀,哈哈。

    以及以及,也是想给自己在这个项目上的付出画个句号~ 感谢过去一年多的这个项目,让我成长很多,哈哈~

    相关文章

      网友评论

          本文标题:驾车导航场景的语音对话设计

          本文链接:https://www.haomeiwen.com/subject/nzcidftx.html