[自译]设计语音体验

作者: ShusQ | 来源:发表于2017-05-09 23:56 被阅读108次

    原文链接:Designing Voice Experiences

    原文作者:Lyndon Cerejo

    基于语音的界面变得更加的普遍了。Siri和Cortana等语音助手已经存在了好些年,但是在过去的几个季节中,Amazon和Google的语音驱动设备已经走进了百万的家庭。

    VoiceLabs最近的分析显示,今年有2450万语音设备使用,是去年的四倍,作为体验设计师,我们现在有机会去设计语言体验和界面了!

    一个新的界面并不是意味着我们完全不顾及以往成功的界面。我们需要为语音界面的细微差别作出努力,包括对话交互和无屏交互。我们会看典型用户是如何操作的,讨论在语音体验所涉及到的每个步骤。并通过为Alexa设计一款语音app来列举这些步骤(Amazon叫它Skill)。

    理解语音界面

    就像是移动app运行在OS和设备上,三个层级必须一同工作才可以支撑语音交互:

    三个层级支持交互

    语音app( Amazon Skills 和 Actions for Google )

    人工智能平台( Amazon Alexa, Google Assistant, Apple Siri, Microsoft Cortana )

    设备( Echo, Home, smartphones, computers )

    每一层都需要关联到下一层,并且去支持上一层级。语音界面位于上面两层,这两层都在云端,而不在设备上。

    让我们看看下面的例子,了解这些层是如何工作的,使用Alexa Jeopardy!Skill作为例子。

    可用语音交互层

    语音驱动设备都在持续地倾听,像是Amazon Echo 和 Google Home,都在等待唤起(“Alexa...”和"OK,Google...”)去执行动作。一旦被激活,设备会将收集到的音频发送到云上的AI平台(“玩Jeopardy吧~”)。平台使用自动语音识别(ASR)和自然语言理解(NLU)来分析用户的意图(开始玩游戏)然后将它发送给app(Jeopardy!J6 Skill 在Alexa上)。然后app处理请求然后通过文本作出响应(如果可以,也能进行可视化优化)。平台将文本转化为语音,然后在设备上运行(“欢迎来到Jeopardy J6,这里是今天的…”)所有的这些都在几秒钟内完成。

    建立语音体验

    去年,Mark Zuckerberg进行了个人挑战,在他的家里建立简单的AI。他做到了,把它叫做Jarvis,并给了它Morgan Freeman的声音。

    Mark Zuckerberg给Morgan Freeman介绍使用了他声音的AI

    我们其他的人可能没有资源去做同样的事情,但是可以在已经建立的复杂AI平台来上建立语音app。这让我们只需要关心语音app的设计和开发。这也是一个简化的开发过程。Amazon 和 Google 提供了开放的模板,代码,和详细的构建不同语音app的命令。甚至是非开发人员也可以在一个小时里开放出一款app。

    他们简化程序开发方面的投入正在取得回报。每个月都会有数以千计新的语音app诞生。语音app的增长让人们回想到了上世纪90年代的网络热潮,以及随着app store的推出,移动应用的爆发式增长。

    按类别划分的Alexa Skills,2017年5月

    在这个拥挤的语音市场,优秀的设计将会让你的语音app和其他数百款类似的app中脱颖而出。

    设计语言体验

    在开始研发之前,需要有5个步骤来设计优秀的语言使用体验。虽然直接投入到研发中很直接,但是花费在设计上的时间是值得的。

    设计语音体验的步骤

    我们将会讨论并应用去设计语音app,这也会是使用Skill templates for Alexa开发的简单应用。

    1.发现

    通过问题来开始设计,“这款语音app会给用户带来什么价值?”这个问题应用不论你是否正在开发独立的语音app或你的语音app只是用户的一个接触点。仔细想想为什么人们使用语音app。人们使用语音界面,因为有解放双手的交互,交互的速度和易用性,主要的使用场景可能是在家里,车里,这在2016年的Mary Meeker的互联网趋势报告中有体现(http://www.kpcb.com/blog/2016-internet-trends-report)。

    使用语音界面的理由(来源:KPCB)

    去发现主要用户需求的关键是,通过语音app比手机和电脑更加便宜,一些例子,像是银行提供账户信息,和在附近打算找电影看看。

    如果你的竞争者已经有了语音app,请仔细思考他们在做什么,去看他们的更新,已经在应用市场中的评价。(例如Amazon’s Alexa Skill Store)。目的不是盲目的模仿,而是要了解已经设置的功能项,和对用户的期望。

    (写这篇文章的时候,有超过1500“知识和琐事”的Alexa Skills,这成为了Amazon上最拥挤的技能类别,然而在用户体验方面,并没有简单的小技巧。为了演示语音设计的过程,我们创建了UX设计技能,让我们的读者能过测试他们的知识或学一些新的东西)。

    2.定义

    在这个步骤上,我们会定义它将有的功能和个性。

    个性

    在设计语音界面时,我们无法接触足够的视觉元素,像是web或者mobile上的那样个性。这个个性必须通过语言的交流,声音和音调来表达。不同于Mark Zuckerberg,听到的是Morgan Freeman的声音,我们听到的是设备默认的声音。这使得语气和措辞在传达我们想要的个性方面至关重要。

    好消息是这一块领域的基础已经完成的差不多了,会记录在一个公司的品牌指南,或者网站风格指南中,在你的语言app中使用这些指导原则,在不同的渠道和接触点上保持一致的个性。

    Virgin America的品牌个性(图片来源:http://vxbrandguidelines.com

    如果你有让Alexa唱过歌,或尝试复活节彩蛋,那么你就会了解她的个性。出于好奇,我接触了负责她个性的团队,这是他们所说的:

    “在设计Alexa的声音时,我们希望她有个性去反应出Amazon的价值观,我们希望她乐于帮助,谦虚,而且聪明,同时还十分有趣。这是一个持续的过程,我们预计Alexa的声音会随着开放人员的增多,进化得更加聪明。”

    这种个性也可以反映在app的名称,图标,和显示给用户的描述中。所以在发布你的app时,确保它能过吸引用户。

    对于我们的用户体验技巧,我们可以采取直接或者有趣的方式,这会反应在我们的问答措辞中。一个正常音调的例子是:

    哪个UX设计原则更倾向简单而不是复杂性?

    奥卡姆剃刀

    西科斯定律

    Aesthetic-usability效应

    Satisficing

    一个有趣音调的例子是:

    显然,有有一个UX设计原则更偏向简单,而不是复杂,你能够猜出它叫什么吗?

    奥卡姆剃刀:最好的用户体验。

    西科斯定律:听起来像是一个门外汉会想出来的。

    Aesthetic-usability效应:这是一个花哨的UX行话。

    Satisficing:嗯..我向滚石乐队道歉。

    是的,让我们保持正常。

    功能

    你应该仔细想想哪些功能,你的语言app对用户而言是有价值的。从第一步审视你的工作,确立核心功能和提高业务能力。有时候,提供的核心功能显而易见,比如银行提供关于余额,交易和到期日期的信息。其提供相关功能表单的价值,例如Tide的引导语音app,或Glad的语音app,其中一个可以帮助用户记住存储他们的剩菜,另一个运行用户检查哪些应该回收。

    如果你将相似的体验从web迁移到了mobile。这可以作为服务的起点。对语音功能而言,考虑哪种功能可以让你的用户受益。在一个语音驱动的设备上去塑造。如果技能有安全或者隐私的影响。可以考虑添加一个级别的保护。(Capital One Alexa Skill允许用户创建个人账号访问),虽然你可能会得到一个在语音上的功能列表,但从1~5个核心功能开始,并使用语音分析进行跟进和改版。

    用户体验设计技能的核心可能是:

    根据需求提供用户体验的设计原则;

    测试用户的随机性原则;

    测试用户在多个体验下的原则;记录分数。

    与多名用户进行UX测试。

    因为我们正在建立UX设计技能,使用Amazon的技能模版,我们的选择目前仅限于第一(当前技能模板)或第三(琐事技能模版)选项。假如我们的研究表明,我们的用户会觉得进行测试比听听原则更有价值,我们的核心功能会继续测试原则并记录分数。

    3.详细对话流程

    既然你已经列出了语音app的功能,那么可以开始关注app与用户之间的详细对话流程。人们的对话是复杂的,它会有许多的转折,人们经常从一个话题跳到另一个话题。语音AI平台还有很长的一段路要走,才能到达这样一个复杂度,所以你必须教会如何对用户做出反应。

    你的语言app只能支持你在先前列出的功能,但用户总能以各种形式向应用发问。详细描述对话的流程,可以让你对用户做出回应,或者让对话朝着应用程序可能为用户做的事情进行。

    对于语言app所支持的每一项功能,都是以创建用户和app的对话开始,类似于剧本中的对话。当你写这些对话的时候,要记住你的个性,声音以及语调的特点。开始创建和整理你的语音app程序的实际内容,对于我们的测试而言,这意味着建立一个测试问题的列表。

    从理想的路径开始-语音app的对话流程可以响应用户的请求,不发生任何的异常和错误。然后找出对话中可能存在的异常(用户不提供完整的信息)和错误(app不能给理解或不能够照着用户的要求去做)。

    因为谈话是被,听到,而不是阅读,一个好的实践是大声的读出来,看看这像不像是自然的口语对话,并检查它是不是传达出了你预期的语调。

    如果你的语音app需要通过手机app的内容来补充对话内容,那么可以统一成一种交互模式,这样用户就可以无缝地进行交互。Tide的去污技能告诉用户他们可以在Alexa app上去污。那么关于新的Echo可以触屏的传言可能是真的。

    下面是一个关于理想路径的对话示例,我们的体验设计技能的核心:

    user:Alexa,开始UX设计测试。

    Alexa:我会问你5个问题,可能有多选。尽可能多的回答正确,只需要告诉我选项,我们开始吧,问题1...

    user:正确的回答…

    Alexa:正确了!你现在的得分是1。接下来是问题2...

    user:正确的回答…

    Alexa:哦~,这是错误的答案,正确的答案是【】,你的分数是1.接下来是问题3...

    Alexa:(在5个问题之后)正确!5个问题中你回答对了4个,谢谢你的参与!

    4.描述交流短语

    人们并不总是用同样的词来表达同样的意思,语音app也需要被教导。Phrase-mapping是一个练习项目,用来适应用户所说短语的变化方式。

    对于您在前面对话步骤中详细描述的每个对话路径,轻考虑用户可能会通过不同的单词来进行表达。然后分解每个请求的措辞。并识别他们可能使用的同义词,包括任何地区的变体和方言。如果你的声音处理碳酸饮料,那么可能包括汽水,pop,可乐,饮料,碳酸饮料等,长三明治包括sub,超大三明治,意大利三明治,面包等,运动鞋可能会是运动鞋,鞋,沙滩鞋,跑鞋,网鞋等。

    尽可能的完善和详细这些列出来的变化列表,以便您的语音app能够理解用户的请求。Alexa需要理解这些变化形式,尽可能多的代表短语。“取决于你个性的声音,表达的方式可能有好几百种,有很多方法来简化话语的产生。”

    下面是一个Phrase-mapping,对UX设计测试的功能示例。Alexa的人工智能平台很好的将用户意图转化为他们的模版,但是如果你进行了更改,那需要补充短语。

    5.完善

    设计过程中的最后一步是验证和完善语音app,然后花时间和精力在开发商。在“细节”步骤中,大声朗读有助于确保他们听起来足够的自然,现在的步骤是测试用户的语音界面。

    最简单的方法就是使用Oz技术向导,一个人扮演设备使用者,并根据界面脚本做出响应。另一种选择是使用SaySpring这样的原型软件来创建和测试交互原型。

    如果你的语音app正在通过代码模版创建,那么它可能更容易地创建应用程序,并使用Amazon和Google的测试工具,在设备上进行测试模式。

    这个测试会给你真实世界中很好的语音体验,包括处理错误,重复反馈,还有不自然,强迫,或机械般的回复。

    开发

    现在语音体验已经被设计了,是时候开始build-test-submit阶段,每个平台都有详细的指导和教程,来帮助任何人构建和测试技能,包括Alexa设备,为Google开发Actions,Cortana等。

    思考你的反馈回路有助于您理解app如何使用语音。你可以通过开发者账号得到技能指标(用户、对话、话语意图),但是可以通过免费服务,例如VoiceLabs进行分析服务。

    在你构建和测试语音app之后,最后一步是精简的提交过程。由于Alexa的skill市场发展迅速,发现有用的新app十分困难。在Amazon改进之前,使用你的语音app中可见的列表元素,来帮助用户找到并尝试你的技能,包括图标,名称,和相关描述。

    匹配的技能可以在Amazon的Skill store中进行:UX Design Quiz

    指导原则

    这里有一些语音体验设计的指导原则。Amazon和Google提供了更多的原则,关于该做和不该做的事情。

    通过用户可以理解的方式介绍app。

    “欢迎来到UX Design Quiz。我将会问你5个关于UX设计的5歌问题,看看你现在掌握的如何。你可以要求我重复问题或者跳过。你现在准备好了吗?”

    虽然是与语音app交互,但也需要一个语音界面来帮助用户实现短期记忆。

    Alexa:“这个原则是14世纪的逻辑学家和方济会士提出的,他在英国的Surrey村庄出生。简而言之,它认为简单比复杂性更好。这种解决问题的原则可以很容易地应用在UX Design上,通过更简单的设计解决问题,这个原则叫什么?

    你的第一个选择是:奥卡姆剃刀,有时称为吝啬法则。

    下一个选择是西科斯定律,也被称为Hick-Hyman定律。

    下一个选择是:aesthetic-usability效果。

    最后一个选择时:满意,而不是牺牲?

    请从ABCD四个选项中做出选择。”

    user:“嗯..Alexa,重复一遍。等等,结束测试!”

    示例比命令更好。

    命令:“请告诉我你的出生年月日。”

    示例:“请说出你的生日,例如,1990年4月15日。”

    没有风险的进行交互。

    这也是一种行为的平衡,太多会难以应付。

    让重要的行为更加醒目,让隐藏的风险更低。

    如果你让Alexa去关灯,你可以看着它发生,而不需要去确认,尽管有时候时多了一个“OK”。

    使用高亮的两条原则

    为失败设计

    事情都会有糟糕的时候,为这些场景做设计。包括无法理解问题和信息,信息不完整,请求无法处理,给用户回复默认的选项等。

    结语

    任何时候尝试和一个人发生互动,你都必须将人看作是很先进的操作系统。你的最高目标就是去模仿他们。

    – K.K Barrett, Her movie production designer, Wired, 2014

    如果你还没有看过电影“Her”,那就花上时间看看这部未来主义的电影吧,讲述一个孤独的作家和OS之间发生的故事。虽然这个时科幻小说,但是在今天的世界里,随着采用独立语音设备的普及Amazon Echo 和 Google Home ,语音体验也在不断优化,通过Amazon和Google的平台,开发语音app是一个相对简单的过程,但是体验不是偶然,它应该经过设计。

    相关文章

      网友评论

        本文标题:[自译]设计语音体验

        本文链接:https://www.haomeiwen.com/subject/rmzitxtx.html