随着互联网的快速发展,许许多多原来不太现实的事情也一步一步实现了。尤其是当前在语音识别领域,人工智能已经呈现出了十分良好的态势。无论是独占鳌头的科大讯飞,还是投入巨资的百度,抑或搜狗等输入法工具,在语音识别上都获得了长足的进展,使得语音写作能够成为现实。
相较于传统写作方式来言,语音写作在创作方式上有很大的不同。语音写作即通过语音识别来自动的将我们所说的话转变成文字,从而完成我们的文章。这跟传统的使用笔、纸或者通过敲击键盘来创作文章有着很大的不同。相对于语音写作来言,许多人都抱着一种观望的态度,当然也有许多人摩拳擦掌想要尝试一下这种新型的创作方式。那么,首先我们要思考的一个问题是,为什么要进行语音写作,语音写作能够带给我们什么?这里主要包括以下几点:
第一,语音写作比传统写作方式创作效率高出数倍。
也就是说,我们原来需要一个小时、两个小时甚至更长时间的写作内容,通过语音写作这种方式可能只需要十几到20分钟就可以完成。作为软件工程师,一直以来我都对人工智能领域有着十分巨大的热情,也在第一时间尝试了语音写作这种写作模式。在我以往的写作统计当中,我使用键盘写作的效率并不高,差不多每个小时只能写一千字。而使用了语音写作之后,对于普通的讲解、说明类的文章,我的创作速度可以达到每小时6000字左右,效率整整提高了六倍。当然,作为一个作家,我也积极地将语音写作运用在了长篇小说创作中。在我创作的《紫夜蓝》系列小说中,在将近20万字的语音写作体验里,我发现自己边构思小说边通过语音来进行创作,速度大约是每小时3000到4000字。不管怎样,这个速度都已经远远超过了我使用键盘创作的时间,切实地提高了我的创作效率。
第二,语音写作解放了我们的双手,使得我们没必要整天苦逼地坐在电脑前进行写作。
在以前的小说写作过程中,每天工作一天之后常常累得腰酸背痛,却还是不得不坐到桌子前对着电脑屏幕保持着一个僵硬的姿势不断地敲打键盘。久而久之,感到整个人的腰椎、颈椎都有一些不适感。而语音写作吸引我的一点是,一部手机就可以开始我的写作之旅了。如果我愿意的话,可以坐着、躺着、甚至走着来完成创作。有一段时间,我在操场上慢跑时,也尝试了在跑步中进行语音创作,这使得整个创作过程十分的惬意悠闲,大大减轻了长期保持同一个姿势的身体压力。
第三,语音写作能够带来一种沉浸式创作感。
在以往的传统写作当中,当我坐在电脑前敲击键盘的时候,我的眼睛会盯着我敲击出的每一个字,每一个词,每一句话。一旦发现有一个词用的不好,或者有一句话写得不好的时候,我就会疯狂地敲击删除键把这个词或句子删掉,替换成新的。这使得我的创作过程有两种思维在同时进行,一种是构思小说本身的故事情节,另外一方面则是在遣词造句上。而使用语音创作之后,我突然间感觉打开了一个新世界一般。我只需要闭着眼睛在脑海中构思情节和场景,并且通过自己的语言来把这个情节和情景再现出来就可以了。而对于字词方面,由于语音写作过程是连续的,所以不会被某个不满意的字词打乱掉而影响到整个创作进度,这使得我的整个创作过程十分的享受,有一种沉浸感在里面。我想这是语音写作能够提高创作效率的原因之一。
第四,语音写作让我们有了在任何时间任何地点进行创作的可能。
在以前的写作过程当中,用电脑来进行写作是一件很费事的事情。当然,在有一段时间里,我也尝试了iPad加上蓝牙键盘的创作方式。这样显然比笔记本电脑轻便了很多,但是依然有它的局限性。而当前,手机上已经有许许多多的语音输入法了,包括科大讯飞、百度输入法、搜狗输入法等,通过这些输入法,我可以在手机上就完成语音创作过程,再加上现在无处不在的4G信号,这使得创作变得十分的简便,也不再依赖于笨重的设备。
说了这么多,我想大家对语音写作应该有一些跃跃欲试了吧!不过有几个问题是语音创作过程中绕不开的,在这里先把它们列出来,在后续的文章中,我会针对这些问题一一结合自己的真实经验来讲解如何克服它们。
第一个问题是,语音写作在我们创作习惯上的改变。
通过语音的方式进行写作,这显然与我们大多数人的写作习惯是不同的。很多人都喜欢在写作过程中边写边思考,这样我们有足够的时间来进行思考。而语音创作的话,则要求我们边说边思考,这使得我们思考的时间变得很短。而思考的节奏也跟敲击键盘或者笔纸创作有很大的不同。针对这个问题,我想说的是要想实现一个高效的语音写作,那么一定要经过一个特定的训练。这个训练需要让我们掌握一种能够边说边思考的能力,或者说即兴演讲的能力。可能很多的读者在尝试语音写作过程中在刚开始的几分钟内还能有条不紊的写下去,但是一旦时间稍微长一些就会发现自己开始满嘴跑火车,写出来的东西不知所云,毫无条理可言,这就是缺乏训练的缘故。在这里,对于刚刚尝试语音创作的作者而言,我想提的一个建议就是充分的利用好大纲的能力。当我们还没有完全掌握好边说边思考的能力时,我们可以先对我们想要写作的文章列出一个大纲来。一旦大纲制定好之后,那么我们的写作过程就会变得相对容易一些,从而能够使自己的思维控制在大纲之内,保证不会出现满嘴跑火车的情况。当我们对于语音写作方式越来越熟练之后,那么大纲的内容可以逐步减少。相信这个时候,我们会对自己边说边思考的能力感到大吃一惊。
第二个问题是,当前的语音输入法识别率有限。
当前做得比较好的科大讯飞输入法的识别率约为95%。也就是说,语音写作创作出来的内容会存在5%的错别字,这是降低我们语音创作效率的原因之一。针对这个问题,我的主要建议是,一方面我们要练习好自己的普通话,尽量让自己的发音做到标准,从而在根本上提高识别率。另一方面,我们也应该充分的利用科大讯飞输入法当中的自定义列表,比如说在小说创作中的一些人名、地名等,这些都可以作为自定义列表,这样语音识别软件在识别这些词的时候准确率就会大大提高。还有一方面就是在当前的技术水平下,我们还不能保证语音创作完的文章可以直接发表,那么很重要的就是后期对文章的整体修订。当前我的这部分修订工作依然在电脑上进行,主要包括错别字的修改以及个别字、词、句的调整,而相对创作而言,这部分修订工作变得轻松很多。相信未来随着人工智能的逐步发展,识别率会逐渐接近100%,这部分工作量也会越来越少。
第三个问题是,段落排版和标点符号无法有效识别。
在语音创作过程当中,段落排版和标点符号,是一块不得不提的内容。在现在的语音识别输入法当中并没有提供段落排版的功能。通常我们创作的内容都会成为一整段,这使得我们的后期整理十分的麻烦。而另一方面,对于标点符号而言,当前的处理比较的粗糙。傻瓜一些的直接在每句话的后面加句号,智能一些的根据停顿长短来加逗号或句号。但是无论哪种模式,我们的文章中都会出现很多无用的甚至重复的标点。显然,这不是我们想要的一个结果。针对这两个问题而言,其实我们可以借助一些外部工具来帮助我们在创作过程中完善排版和符号内容。在经过大量的语音写作实践后,我发挥了自己软件工程师的特长,开发了一款适用于语音写作软件的工具,这个工具能够帮助我们在创作过程中进行分段,并实现标点符号的智能纠正,目前得到了不错的效果。我想后面有机会的话,会把软件放出来让大家一起使用。
第四个问题是,通过语音创作的内容在文字的精雕细琢上有所欠缺。
这一点可以说和第一点是相通的。内容是否精雕细琢主要还是依赖于创作的功底。当时单纯从创作形式上来讲,通过敲击键盘来创作时我们的眼睛盯着屏幕上的字,有这样的一个思考遣词造句的时间,所以在电脑上的创作会稍微书面化一些。而通过语音创作则依赖于口头输入,所以有时会偏向于口语化一些。对于这个问题,我想我们还是需要更多的训练和练习来逐渐地控制我们的语音创作内容。如果有朝一日我们能够做到出口成章,那我们的功力一定是上了一个很大的台阶!不过,更偏口语化一些也不完全是劣势。在一些时候,这个也可以翻转成一个优势。就像我一样,之前在电脑上创作《双城劫》这本小说的时候,身边的朋友都觉得我的用词太考究了,场景描写太多,导致整个剧情推进得很慢,读起来很费力。而当我采用语音输入法之后写作的小说《紫夜蓝》拿给他们看,他们的统一反馈却变成了读起来很有生活气息,很轻松愉悦,很好看。可以想见,从让读者读起来更轻松愉悦这一点上来说,有时候语音写作也有其独特的优势的。
好了,今天先说这么多。作为我的语音写作系列文章的开篇,希望能够对大家有所益处。针对今天所说的内容,后续我会进行细致的分享,包括一些具体的实施细节以及我自己在语音创作小说过程中的一些体会,谢谢大家!
凡柯,软件工程师、作家,酷爱编程、旅行、演讲及写作。
(注:本文通过语音写作完成,若有错误请及时指正,也欢迎与我交流,谢谢!)
网友评论