本文适用人群:以可用性分析师、用户研究工程师、交互设计师、产品经理为主要阅读对象。
可用性测试特点
洞察力
小样本的可用性测试是定性的,它不是要证明什么,而是要让您获得来自改善产品的洞察力。
因此,测试不会中规中矩,也不用那么科学。这意味着只需测试少量的用户,只要能获得所需的洞察力就可以。
灵活性
可以在测试过程中途改变规则,例如,如果第一位参与者不能完成某个特定的任务,而且其中的原因显而易见,您可以修改这个任务,甚至让其他参与者跳过这个任务。
简化性
和定量测试相比,则不需要收集数据,只需要主持人和参与者坐在一起,将要执行的任务交给他,并让他在执行任务期间进行发声思维就可以了。
从中确定要修复的问题以及如何修复它们。
可用性测试流程图
流程
确定测试任务
要观察用户如何使用我们设计的产品,需要预先确定若干既定的任务。这个过程由两步组成。
指定一个任务清单
第一步是制定一个清单,包括访问者在「搜狗手机输入法」中需要完成的那些最重要的任务。
1.准备一张白纸.
2.列出访问者需要在「搜狗手机输入法」中完成的5-10件最重要的事情.
列出这份重要任务清单很容易。事实上,web小组成员列出的清单中,会有很多任务是重叠的。
这里的诀窍是确保测试的任务反映了用户的实际目标,而不是您认为的用户想做的事情。
确定测试哪些任务
在持续50分钟的“一小时”测试中,参与者通常有35分钟的时间用于完成任务,您可以选择一个足够长的任务,亦可选择多达10个小任务。
完成任务的速度因人而异,因此务必准备额外的任务供提前完成的参与者做。一个不错的“补充”任务是,让参与者在竞争对手的「搜狗手机输入法」中执行测试任务之一。
撰写测试场景
(1).将任务变成场景
确定要测试哪些任务后,您面临一项写作任务:将有关任务的简单描述转换为参与者能够阅读、理解并遵循的脚本。
这包括:指定用户的角色、动机、需要做的动作、以及更多的细节
难点
编写情景时,真正困难的只有一点,那就是不要在情景中提供线索。
措辞必需清晰、明确、易于理解,而且不要使用屏幕上不常用或独特的词汇。否则,任务将变成一场捉迷藏式的游戏。
例如:
糟糕的措辞:请挑选一件最给力的婚纱。
更好的措辞:请挑选一件您最喜欢的婚纱。
(2).对情景进行先导性测试
编写情景后,需要对它进行先导性测试(pilot test)。目的是确保情景清晰、正确、完整。
1.找一位同学坐在要测试的电脑前;
2.口述场景并让他尝试完成每项任务就可以,在这种测试中,可以让任何人做参与者。
先导性测试不需要完成的时长,通常15分钟就能够完成。正式测试前一两天验证为宜。
核对测试清单
在主持可用性测试时,有很多事情必需在特定时间进行,而且有很多细节需要跟踪。你可能记得完成大部分工作,但检查列表让您不会错过每一个事项。
如下测试清单,可根据具体情况进行修订。例如:可能需要提前一个月申请用户支付报酬的现金。
测试时间约定
测试时间不宜太长,测试将持续约60分钟结束。
1.欢迎环节(4分钟)
每次测试都是以宣读脚本的第一部分作为开始,它解释了接下来的测试如何进行。
2.提问环节(2分钟)
通常在测试前,都可以问参与者一些简单的问题,目的是让参与者放松,让参与者表明测试即将开始。
3.主页观光(3分钟)
测试「搜狗手机输入法」时,通常让参与者首先浏览主页并简单说说他们是怎么理解的。目的是判断「搜狗手机输入法」的特征是否明显。
4.执行任务(35分钟左右)
任务是测试的“核心”所在。在执行每项任务前,您需要逐字宣读情景描述。
5.问题探讨(5分钟)
当参与者执行任务时,您肯定会注意到有些地方需要更深入的了解。
6.道别(5分钟)
向参与者表示感谢、询问他们是否有问题、给报酬并将他们领到电梯前。
7.准备下一场测试(10分钟)
建议测试持续50分钟,而不是一小时。需要在两场测试之间留些时间让您头脑清晰,理解思路,调整生物钟。
确定主持人
1.负责在测试间坐在参与者旁边,给他发指令、向他提问。
2.负责未来培训别人来做这项工作。
作为主持人,将扮演两个角色。
导游:负责吩咐参与者做什么,接下来做什么,并让他们心情愉快。但与真正的导游不同的是,您不会回答有关风景(这里是「搜狗手机输入法」)的任何问题,参与者必需自己判断如何使用看到的东西。
问询者:您的主要职责是让参与者在执行任务时用语言描述其思维过程。这意味着你将鼓励参与者尽可能进行发声思维(think aloud)。您希望他们在使用「搜狗手机输入法」的过程中不断叙述心里的想法:他们在试图做什么,他们在看什么地方,正在阅读或浏览什么内容,心里有什么疑问。
主持人职责
1.您尽可能的让参与者用言辞将他们的思考过程表达出来。
2.您可能不影响他们。需要保持中立,你不能告诉参与者该怎么做,他们需要自己找出解决方案。“你在想什么?”、“你在找什么”、“你在做什么”
3.您不断重复一些相同的话。
4.您负有道德方面的责任。
招募测试用户
招募哪种类型的用户进行测试?
1.有代表性的用户
2.实际使用网络的用户
3.类似目标用户的人
4.视具体测试情况而定...
需要多少位用户?
三位用户足矣。
实践证明,相对让更多的用户完成相同的任务,回报越少,因为观看的用户越多,发现的新问题越少。大多数人为此争论都集中在到底测试多少用户才会发现产品的大部分可用性问题。但对于小样本的可用性测试而言,是通过测试发现那些急需修复的问题。使得测试和总结可以在同一天完成。
邀请测试用户
1.决定到哪里去招募后,需要发出招募参与者的通知
例如:
我们将于x月xx日(星期x)对「搜狗手机输入法」进行可用性测试,现招募几名参与者。测试将在xx的办公室进行,持续时间约60分钟。特招募具有如何特征的用户。1..2..3.....
如果您有意且当日有时间参与,请给xxx发邮件。邮件地址xxx@xxx.com。请在邮件中提供您的姓名、电话号码以及合适的联系时间。【此过程亦可附报名表单】.
2.筛选并简短交流,确定最合适的参与者
收集大量可供选择的用户后,需要进行筛选,这意味着通过电话进行简短的交流。通过电话交谈,你需要完成下面几项工作。
1.核实测试当天是否有时间。
2.核实是否具备所需的资质(有些人会为了报酬夸大其词,而你不要直到测试的那天还蒙在鼓里)。
3.说明测试时间需要约1小时左右,他们将会在测试期间屏幕录像等。让参与者做好心理准备。
4.告知为此付出的时间将得到什么样的补偿。
5.判断他们是否像优秀的参与者。看起来是不是能接受发声思维,是否善于表达。
3.后续邀请
发送邀请邮件,并提供详细信息:何时、何地、干什么。行车路线等
发送准备保密协议(便于他们在测试前阅读)。
测试前打电话给参与者,核实他们能够参加,并解答任何疑问。
4.礼尚往来
可以赠送参与者额外的奖励,如公司纪念品周边(杯子、T恤等),参与者心情会更加愉悦。但是有时候一份感激就足够了。
国内对于补偿测试者时间,约为每次/200元。 每场测试/1小时。
通常情况下,报酬应比对其时间的估值高一些,一方面表明我们看中他们的看法,一方面让参与者更愿意按时到场并积极参与。
5.储备备用参与者
如果和参与者建立了友情关系,可以作为以后其他项目的测试用户。
总结测试问题
总结的目的非常明确-你希望带着两样东西离开房间
1.参与者使用「搜狗手机输入法」时遇到的最严重的问题清单。
2.下个月测试前要修复的问题清单。
总结应在测试完毕后立即进行,此时每个人都还对测试过程中发生的情况记忆犹新。
如果可能,需要规定,只有至少在当天上午参加了一场测试的人才能前来参加总结会,这是获得会议发言权所必需付出的代价。这有助于将总结重点放在测试期间实际观察到的情况和问题上,从而避免将总结会变成各抒己见的“辩论会”。
优先考虑最糟糕的问题
(理解)在修复可用性问题方面,你要明白以下几点都是对的:
1.任何「搜狗手机输入法」都存在可用性问题;
2.任何部门为了修复可用性问题而投入的资源都是有限的;
3.总是有问题因资源有限而无法修复;
4.因简单且容易解决而先解决,导致最糟糕的问题得不到修复;
5.必需集中最优资源修复最严重的问题;
若不遵守以上原则,则肯定下一个月最严重的可用性问题还会存在。
网友评论