输入法背后的科技争霸

作者: 沛文沛语 | 来源:发表于2018-08-23 23:20 被阅读80次

2000年左右开始学习电脑的时候,第一个学习的就是如何用电脑打字。要把一个一个的方块字通过26个英文字母对应起来,汉语拼音在小学的时候都已经比较熟练掌握了真正系统的学习英语是从初中开始打字最开始的事,玩打字游戏,然后老师会交代练习作业,那个时候觉得手特别笨,手指在键盘上找半天,找不到键在哪里,觉得打字好费劲。然后除了游戏,娱乐影音之外的时候,电脑也没有多少好玩的地方。那个年纪确实也不会玩。加上联网所能获取的信息娱乐远远没有今天这么丰富,所以对于电脑的依赖也没有那么强,大部分信息的获取还是读者,报纸这些杂志之类的。其实想一想,那个时候每年花在买报纸,买杂志,买书刊,这上面的费用折合成今天的费用,也不比今天的信息消费要低了。

打字游戏 打字游戏

真正的开始对打字的速度有所追求,或者觉得是一个想非常渴望你去拥有的一门技能是从开始玩QQ开始。那个时候的QQ其实是养活了一大堆的网吧的,很多人去网吧的最主要的事情就是玩QQ,QQ可以让你在电脑面前大段的时间和另外一个人或者一群人来聊天。聊天那主要就靠打字输入,如果对方发一个消息,你回复的比较慢,这在当时是被认为不礼貌的,而且很多人就可能不会跟你聊天儿了。所以对于快速的回复,去制造这种聊天的氛围成为了一个技能上的刚需。在这种过程的熏陶过程中,在QQ开始成为一个杀手级应用的过程中,我以及很多人的打字技能开始得到系统性的训练。从原来要看着键盘找着键盘去,达到逐渐的可以盲打,到打字速度越来越快。其实这个时候同时兴起的还有博客,但几乎没有人或者很少的人是通过写博客来完成自己的打字技能训练的几乎全部是靠聊天而来训练了自己的打字技能。那个时候的输入法主要包括智能abc,微软拼音,五笔输入法,双拼等。由于大多数人在小学的时候都接受了系统性的拼音训练,所以大部分人是选择从拼音输入法开始,而五笔输入法又要求再次的进行训练,所以很多人没有选择用符笔输入法,选择用五笔输入法,后来我才明白,还有另外一个问题。其实从思维的方式上来讲,用拼音输入法会更自然的能够表达你的思维,用五笔输入法还是另外一种思维模式,需要中断你现有的思维模式。就好比说用拼音输入法是想说话一样的心理行为而用五笔输入法是像写字一样的行为一个是语言感应式画面感,这俩在大脑中对应的区域是不一样的。如果你要让这两个区域同时工作,那就需要来回不停的切换,其实对于思维的连续性和思维的表达是有影响的,这个已经有科学家做过严谨的测试。

使用拼音输入法的好处是显而易见的,不需要再次的进行技能性的训练,但坏处是对键盘不熟悉。键盘的设计也不是abc顺序的,而是一个乱序的过程,这个我之前做过比较完整的考证,也在2008年的时候去写过一个这方面的论文。那么打字熟练的过程其实就是一个熟悉键盘布局的过程。熟悉这个过程还是有一定障碍的,我到今天发现很多人使用了很多年的电脑,打字速度超过一百字每分钟的也不算特别多。

到了08年,我开始意识到去写博客,那个时候其实也是跟风了,徐静雷成为博客的一个非常出名的名人,成为那一段时间圈子里面的一个风向标。据说那个时候的博客浏览量就达到了千万级别,风光一时无两。但是写博客也没有坚持下来,断断续续的,大概是到10年左右,才有了一段相对稳定高产的时间,一个月会写个五六篇,然后毕业之后,大概每个月会写一篇,坚持了34年,又中断了两年。这个转变的过程其实是一时的心情日志,是一个对我不再有吸引力的过程。更多心情的表达转向一个研究性的表达事实性陈述性的表达。这期间对外公开发表的文章少了,但是我写了非常非常多的邮件,在这个过程中,对于邮件的写作训练得到了一个系统的提升,对于各种办公工具的熟练运用,也在这个时间得到了一个提升。这个算是我重新认识写作的过程,工作中的写作表达,商务写作是不需要文采的,但是你一定要用最简洁的语言把事情讲清楚,而且我有一个事情,不同的说法,所产生的协作结果也是完全不一样的。

徐静蕾的博客

在我上大1,2007年的时候,我们一起去学校对面的网吧上网,我的宿舍同学向我推荐了搜狗的输入法,而我以体验,确确实实比智能abc的输入法要好用不少,还有词库有一句话完整输入,有智能识别。后来我读吴军老师的数学之美这本书的时候,才知道这个过程中为了消除汉语的二义性,其实是用了数学上的最大熵原理。然后我们也开始向身边的人去推荐搜狗输入法。到今天使用电脑输入法,还使用智能abc的已经几乎没有了。再从07年到17年这十年过程中,搜狗输入法成为了我的标配输入法,这个过程中,后来有了输入法账户统计了一下打过的字应该是超过一部《本草纲目》了。

再到后来,手机开始普及,最开始手机上都是有键盘的手机,比如诺基亚的手机,但基本上也都是九宫格的键盘,数字和字母混合在一起。因为手机的体积比较小,面积比较小,容不下这么多键盘,也有全键盘的手机,比如黑莓手机,诺基亚的横屏c600手机等。但这些都不是主流。这个时候的手机输入法基本上都是手机自带的。电脑上的输入法和手机的输入法也不互通,你在电脑上定制的个性词库,一些个性化的输入习惯,在手机上也都无法迁移过来。到后来,智能手机开始普及,手机上可以安装第三方输入法了,然后手机输入法可以把自己的词库下载下来,方言,一些行业专用的词汇,一些个人常用的词汇。

诺基亚C600

新的变量出现:iPhone,软件吞噬世界

但是伴随着硬件的发展,另外一个大变量开始出现了。这个变量就是2007年乔布斯推出的苹果手机。站在今天来回顾2007年那个时候所有人对于今天这个时代的想象力都是非常贫瘠的。这包括高科技圈,各大互联网公司的CEO以及高管们。有人说苹果手机没有键盘还不够酷等等。乔布斯重新定义了手机,与此而来的是手机处理器性能的大幅度提升,手机软件的极大丰富,手机联网开始让电脑的销量逐渐下滑,电脑更新换代的速度逐渐下滑,手机从一个原来用3到5年的功能性产品,逐渐转变为用1到2年的一个消费娱乐产品。几乎所有的人通过一部小小的手机上网连接在一起。

这个时候因为人们上网时长的增加,应用丰富的增加,对于输入的要求越来越高。这个时候还是有了定制化的皮肤之类的这边产品出现。输入法也变得越来越不像一个单纯的输入法,以搜狗输入法为例,加载了非常多的功能。但是整个输入法的界面设计还是延续了,硬件产品上的这种设计,要么是九宫格的,要么是26键盘的,而且26键盘的这个字母排序和电脑还是保持一致的。其实这个时候已经摆脱了硬件的限制,软件有非常大的自定义的空间。但是思维的惯性,用户习惯迁移的难度,还是延续了原有的布局。这个阶段可以说叫软件重新定义产品软件吞噬世界的一个过程。但这个阶段有另外一个变量,还没有开始发挥它的威力。

变量:带宽不再稀缺,语音输入法崛起

这个变量其实就是带宽,最开始手机上网的速度是非常慢的。根本看不了视频等这些消耗流量的东西,但今天用4G的移动互联网已经和wifi没有多大差异了。人们对于流量的消费,已经超过了对通话和短信的消费需求。而且对于流量消费的持续的高速的增长。因为带宽的增加,导致对整个输入法格局的一个重大的变化是我之前你完全没有想得到的。

从我开始习惯用搜狗输入法,到后来手机上延续了这种习惯,我以为输入搜狗输入法的拼音输入已经独霸天下了。但是从科大讯飞的语音识别开始成熟化的商业应用,在很短的时间内,科大讯飞的语音输入法已经成为目前市场占有率第二高的语音输入法。这个过程很大的一个变量和带宽有关系,如果在过去很低的带宽情况下去做语音识别,其实是支撑不了的。语音识别的成熟其实比带宽的普及要稍早一些。当智能硬件普及,用户习惯养成带宽也开始不再成为一个障碍,这些都具备了之后。语音输入法随着人工智能的训练,识别率变得越来越精准。他作为一个更自然,更贴近用户习惯的产品设计也不需要会打字,不需要去适应复杂的键盘,也不需要去学习拼音,他只要会说话,它就可以把你的语音识别出来,即便你是一个三岁的小孩儿,你也可以使用语音输入法就好比为什么苹果手机取消键盘之后只能触摸,是成为更符合人们需要的一个设计,而这个设计出现之后,很多老人学不会,但是很多小孩不用教就会,因为触摸是人的天性。从用户的底层心理构建和操作系统来看语言或者说话这个技能也是人的天性。但打字不是人的天性。整个的互联网产品完成了越来越接近人天性的一种设计。

变量:人工智能导致计算力不再稀缺

到了这个阶段,整个人机交互的带宽是大大增加了,逼近于人和人交互的带宽了。但是还没有超越。过去五笔打字最快是300个左右每分钟,这都需要很长时间的系统训练,普通人根本做不到。但是语音输入法,普通人不需要训练,一分钟400字也是非常自然的一个过程,一输入速度下子就可以提升上来。而且还能识别不同的方言,很多地区对于l和n,z和zh等都区分不清楚。传统的输入法的容错性其实很差。即便计划到个性词库成为一个标配,机器依然是无法适应人的。人机互动的时候,依然是人去适应死板的机器。但是现在人工智能和语音识别的并行发展,导致了语音输入法可以识别多种方言,只要有足够多的语料数据库,它都可以做到非常高的识别率。伴随着算法的改进,算力的增加,越来越多的是机器去适应人,表现出来的其实是显得机器更聪明了。这在传统的输入法中其实做不到。

到今天我已经不再准备去练习自己的打字速度了。我要练习的是自己的发音,更好的让机器听的明白。这样才能更准确的识别出来。

低教育水平人群的需求

最近观察到的一个现象是,我加入了一个我们村里的群。虽然我已经非常习惯微信群了,但是我从来没有想到过我们村还可以建立一个微信群。因为伴随着农村人口城市化,很多人我已经很多年没有见过了。每年待一起的交集也越来越少。印象还都停留在十年前。这个群里的聊天非常的热闹,但是有一个我很不习惯的事情出现了,这里的人聊天几乎没有人打字,几乎全部是语音。而对于在认知中已经建立起微信语音聊天是对别人的不尊重这样的理解,我一时无法适应。但是后来我开始明白,因为这些人很多根本不会打字。他们习惯的就是用语音沟通,他们觉得打字交流才是反人性的,既没有情感,又费事。甚至很多人识字也不多。在我们习以为常的沟通方式,对于他们来说就成为了一个障碍。微信把每个人联系在一起,但是这些人既有输入,也有输出的。过去的软件和硬件的其实不足以覆盖这部分人群。因为使用门槛还是太高。而微信的出现,极大的降低了使用门槛,原来很多教育程度不高的人,也可以很方便的来输入和输出进行交互了。

未来发展:大脑的生理局限和人机接口

但是,科技发展到机器适应人类,输出的带宽逼近人和人的自然语言交流的带宽就是极限了么?特斯拉的创始人,马斯克一直诟病人类的输出带宽太窄了,提倡通过脑机接口来改变人来输出贷款太窄的问题。也许未来的输入法不需要你再通过语音,手等器官的辅助,直接通过脑电波来完成人机交互。这个带宽就远远大于现在每分钟几百字的通信带宽。

这个过程给我的一个启示是,当我们以为竞争结束的时候,只是在一个平面的竞争结束了,在另外一个维度的竞争才刚刚开始。做全拼的搜狗打败了智能ABC,但是又被科大讯飞的语音输入法快速逆袭。但是有一个不变的维度就是越来越符合人性。

参考阅读:汉字输入到底能有多快?输入法狂想杂记

相关文章

网友评论

  • 失落的艺术:全拼输入法用快5年,现在已经转到了双拼输入法,确实,转换思维有些难。
  • 心甬:非常好!仿佛回到了当年😂

本文标题:输入法背后的科技争霸

本文链接:https://www.haomeiwen.com/subject/khfpiftx.html