提问:大家现在语音输入的使用情况如何?观察到的用户都在什么场景下用?
去年锤子手机发布时,罗永浩强推了一波讯飞的语音输入,当时体验觉得无与伦比,但是现在使用的频率却越来越少,观察到周围朋友也基本没人在用。
个人体验是:
1、输入的场景,往往想--》写出文字,会有一个思绪整理的过程,语音输入中,这个整理过程被跳过了,或者是产生了很多无意义的输入。
2、不标准的普通话,输入的错误还是有些多,没有达到宣称的97%的正确率。
以上问题发生多了,自然就使用频率下降了。
wanglongxi:
语音场景这一块,我因为朝夕日历的语音输入功能重新焕发了对日程管理的热情。
记日历简直太适合语音了,天作地和,简单易用!
传统记日历的产品方式对比起来就像石器时代。
z:
在路上行走需要输入文字的时候几乎都会用语音输入,iOS 本身的「听写」不能自己输入标点有点麻烦,其他都挺好的。讯飞确实很棒,可以很畅快的说一大段话。
虽然我自己用的挺爽,但是推荐给周围人的时候不是太顺利,也会有你说的识别率以及「话屎」的问题。
但是技术的进步一定可以进一步改善识别率的,「最右」里支持的语音转文字(同时包含播放原始音频发送出去)。大家可以去观察一下,图文内容的评论,或者是视频内容的弹幕,都有大量用户是通过语音功能发送文字的。
shrinklynn:
口语和书面语差距还是挺大的。我用讯飞会有很多嗯啊之类的词,还不如打字。
kenlee:
同样的情绪表达,说出来跟写出来差距很大,用讯飞转成文字发现完全没有美感,很尴尬。
zoey:
我是一个几乎不用语音输入的用户,原因:
首先,我是一个享受打字的感觉的人,我认为在打字的时候,是给我思考的停顿时间的;
第二,输入这个过程,很大一部分时间是在工作or公众场合,所以不方面说话;
第三,语音输入往往不能准确表示我的情绪上的变化,尤其是我这种颜文字爱好者,还得在语音之后进行修改;
偶尔会选择使用的场景:在路上,双手有东西,极其不方便打字的时候...
rex:
谈一下语音输入法的几个问题:
1、对外界环境要求高,应用场景有限。
一句话就是周围人多就没法用,无论是在嘈杂的公众场合,还是在安静的开放办公室。
2、需要改变用户原有正确的输入习惯。
自从有了手机以来,大家都是使用键盘输入,突然使用语音输入,这个习惯转化的过程非常长,更重要的是语音输入对用户来说的触发点,经常想不起来什么时候来使用语音输入。
3、对于文字输入来说,输入正确远比输入快捷要重要。
体验过语音输入的人都知道,虽然现在讯飞已经把语音输入的正确率提升到97%了,但这97%是需要在理想的使用环境下,使用标准普通话的前提下,像我这种南方人使用,错误率高的让人怀疑自己是不是闲的蛋疼。相比于键盘输入的99.999%正确率,97%的语音输入正确率还差的很远。用户喜欢用微信直接发语音,而不喜欢用语音转文字输入也是这个原因。
老罗在锤子上加入很多语音输入的地方,例如语音找程序、找联系人、找音乐,这是限定应用场景、提高语音正确率,发布会上演示的非常给力,但是实际中依然用的人不多。
为什么,因为目前语音输入所带来的好处不足以让用户改变原有的输入习惯,也缺乏能够触发用户使用语音输入的线索点。
huakay :
1、语音输入是一个更方便且快捷的输入方式,或许再过几年会替代大部分场景下的输入需求,我的主要使用场景是两个家和开车(这两个场景语音输入跟语音差不多2:1)
2、对于文字输入来说,输入正确远比输入快捷更重要,这一点我认为要看具体场景,如果是工作场景那毋庸置疑,但如果仅仅是朋友之间的沟通,语义理解,快捷输入显得更重要,个别或者少量的错字并不影响阅读以及理解语义。
3、不知道大家有没有这样的感受,现在越来越不喜欢去听微信的语音,尤其是一长条的,我更希望是文字,而微信语音的很多场景完全都可以用语音输入来替代。
最后顺便说一下,微信自己提供的语音输入识别率非常之高,且会根据语义来断句以及加上相应的标点。
taitaigao:
@rex 打字输入的高正确率靠的是耗费注意力时刻校正,打字-打错删掉重打-挑字上屏… 先不说挑字,只考虑击键错误,打字正确率恐怕都到不了97%。语音输入一气呵成再回头浏览删改两处,即可做到又快又准。
clark:
@huakay 体验了微信的语音输入,体验比之前好很多了,交互上的一大亮点是,直接把识别文字过程呈现出来,这样用户对局面的确定感很强。 发现识别问题可以及时调整。
讯飞语音时,一长段话说完才出结果,关键南方普通话识别困难。错误率高的次数多了后,就不愿意说长段话了(个人体会)。南方人先天劣势,泪奔。
taitaigao:
@clark 老罗演示之后,大家可能还没意识到语音输入有多厉害。我看了下,讯飞的语音识别模式现在支持:普通话,英语,随声译(中译英,英译中,中译日,中译韩),粤语,四川话,东北话,河南话,河北话,闽南语,客家语,贵州话,云南话昆明,湖南话长沙,山东话济南,山西话太原,陕西话西安,江西话南昌,上海话,天津话,南京话,武汉话,合肥话(以上为语音输入,笑)。语音识别错误之处,还可以上传文字纠正,应该会越来越准。
qiaoxiaodu:
主要参与百度语音助手的设计,从开始决定做公司极其重视,到后来基本维持运营状态,就2年,一直在痛苦的找场景,均发现很牵强。
1.比如走路时的输入,只要中间有一点错误修改都很难,会造成一次以后不再使用。
2.娱乐向,大家都用这个当讲笑话的用来调戏,试过几次也就不新鲜了。
通过语音助手或者平台级别产品,最大的问题是使用场景太过分散,当时从用户query中挑使用场景逐步覆盖,但对于单个用户来说,有一两次结果不好就不靠谱了,这事儿还是应该在必要的场景中去解决。
最近见到了一个极有效果的使用场景——寄快递,顺丰小哥熟练的操作,不仅增加了输入效率,还使得某些地址中需要反复确认的字提高了正确率。
cicada:
快递!一下子就脑补过来那个场面,的确很神。
老罗向往的记者用语音写稿的场面,不知道哪一年才能普及。
网友评论
2.公共场所尴尬,不方便。
3.与人对话时语音很自然,但自我表达时,比如写作、记事等场景,自言自语很别扭的。
4.最最重要,准确率和操作成功率不够高。
- 这个字不知道怎么写才对,恰巧又没有联想出该词汇。
- 冬天手冷,外出必须紧急回复,并且确认周围环境适合公开讲话。
- 联想到智能音箱,我觉得在非使用手机的场景下,只能语音输入了。