美文网首页
大数据视角下,1500部文学作品告诉我们的创作规律

大数据视角下,1500部文学作品告诉我们的创作规律

作者: 云端传奇 | 来源:发表于2019-04-26 06:12 被阅读0次

    在美国历史上,有一桩千古奇案。

    被称之为美国宪法圣经的《联邦党人文集》,原本是由很多篇文章组成的,但是却有两位政治家先后都站出来说,这本文集当中的12篇文章是自己创作的。为了搞清楚这12篇文章的作者到底是谁,美国人争论了好几个世纪,历史学家们从政治观点的角度出发进行梳理,发表了不少文章,但是最终也没有得到一个一致的答案。

    后来,这个让历史学家头疼了好几个世纪的问题,却被统计学家轻而易举的给解决了。统计学家的方法简单而实用,就是统计文章当中一些常用词的词频规律,然后进行比对,这个案件很快就水落石出了,这12篇文章的作者直指詹姆斯·麦迪逊。在经过了大量的验证之后,这一结果得到了历史学家和统计学家的一致认可。

    这虽然只是大数据在文字方面应用的一个个例,但是案件的侦破却给我们带来了很大的启示,如果我们继续运用统计学的方法对文学作品进行分析,会发现什么样的创作规律呢?

    《 纳博科夫最喜欢的词》给我们做出了最好的诠释。这是一本运用统计学的方法分析文字规律的书。它将1500本文学作品作为自己的样本库,将上百位知名作家作为研究对象,通过大数据分析的方法,用清晰明了的数字给我们呈现出了文字背后的创作规律。首先,15位知名作家的167部作品告诉我们,越是伟大的作品,修饰性副词的使用量就越少;接下来,50位作家的600部作品告诉我们,每一位作家都有着属于自己的独特风格指纹;最后,563部《纽约时报》畅销榜首的作品告诉我们,简单的文学作品在变得越来越受欢迎。

    《 纳博科夫最喜欢的词》作者是美国作家本·布拉特,他曾经给《石板》、《哈佛讽刺家》、《华尔街日报》、《波士顿环球报》等杂志撰稿,他对大数据有着特别的偏好,十分喜欢将大数据的分析方法应用于广泛的艺术领域和文学创作领域。《 纳博科夫最喜欢的词》就是本·布拉特将大数据分析应用于文学创作领域的代表作之一。下面,就让我们一起走进文字,一起走进文字背后的数字。

    01 谨慎使用修饰性副词

    诺贝尔文学奖获得者托尼·莫里森说:“我从来不写'她柔声地说'这种句子,如果在此前的文字中没有体现出温柔,我绝对会花费时间和篇幅围绕温柔进行描写,直至让读者感觉出温柔。”

    很显然,如果在一篇作品当中,把类似于“她柔声地说”这样的表述都去掉,换个方式,用人物动作或者是故事情节来显示出一个人物的“温柔”的话,这篇作品就会显得更有说服力。

    同样是诺贝尔文学奖获得者的海明威,一生创作了许多部作品,他不同的作品当中修饰性副词的使用量也不一样,经过统计,作者本·布拉特发现,他的那些经典作品比如《太阳照常升起》、《丧钟为谁而鸣》、《永别了,武器》等,使用的修饰性副词都比较少。而由他的儿子编辑成书的作品《曙光示真》,使用副词最多,文学成就也最低。

    诺贝尔文学奖获得者给大家提出来的建议当然很值得参考,但这也只是个人经验的总结。为了验证这条经验是否存在普遍性 ,本·布拉特参考了20世纪最佳文学作品的四个榜单,找到了包括马克·吐温、斯蒂芬·金、查尔斯·狄更斯等在内的15位公认的伟大作家,对他们创作的167部作品中的修饰性副词进行了统计和分析,最终的结果显示,那些伟大作家的伟大作品确实较少的使用了修饰性的副词。

    数字告诉我们的是文字背后隐藏的规律,对于喜欢写作或者正在学习写作的我们来说, 从创作初期,就应当谨慎使用修饰性副词,想办法通过其他的表达方式让自己的文章彰显魅力。

    02 每位作家的作品都有着属于自己的独特“风格指纹”

    “风格指纹”可以分为两个方面,一个方面显而易见,而另一个方面则相对隐蔽。下面,我们先来说第一个方面,那就是我们大家所熟知的创作领域、创作题材和创作手法,在这一点上,我们有着很直观的感受。

    我们都知道,鲁迅先生擅长创作杂文,他的文章像尖刀、像匕首,语言犀利,剖析深刻;而朱自清先生擅长创作散文,他的文章朴实、优美,平凡的语言蕴含着美的力量。

    同为武侠小说作家的金庸和古龙,虽然写的都是武侠小说,但是他们的创作风格截然不同,金庸笔下的人物动作描写酣畅淋漓,“降龙十八掌”、“独孤九剑”等武功的一招一式、一起一落都跃然纸上;而古龙笔下的人物动作总是十分的简洁,一句话“小李飞刀,例不虚发”已然结束。

    前80回的《红楼梦》和后40回的《红楼梦》虽然讲的是同一个故事,但是我们还是很容易就很看出来,他们不是出自同一个作者之手。这就是每个人不同的“风格指纹”所起到的作用。

    另一个方面,独特的“风格指纹”还指的是某一位作家对于词语的搭配规律和词语使用的特殊喜好,这种规律深深的隐藏在文字的背后,如果不是进行词频的统计,一般很难发现。

    《联邦党人文集》中那12篇文章的作者为什么确定起来那么难?就是因为这些文章是基于同样的文章题材、同样的生活年代、类似的政治观点而创作出来的,并且作者有意隐藏自己的身份。他们虽然从表面上看上去,看不出明显的风格,但实际上,如果把他们纳入统计学的视角,他们仍然有着巨大的不同。这也是为什么使用统计学的方法《联邦党人文集》案可以一举破获的原因。

    同样的,如果同一个作者试图使用另外一个名字创作一部全新的作品,他的“风格指纹”同样也会暴露他的真实身份。当J·K·罗琳(哈利波特系列)使用罗伯特·加尔布雷德(侦探系列小说)的名字进行创作的时候,他的“风格指纹”瞬间就会被统计学的工具捕捉到,身份暴露无遗。

    作家的“风格指纹”对于刚刚开始学习创作的我们来说,是一件好事。因为我们既可以选择自己喜欢的风格进行学习和模仿,又大可不必担心模仿之后会失去自己的风格。

    03简单带来成功

    我们初中语文课本当中有一篇文章叫做《林教头风雪山神庙》,里面讲的是八十万禁军教头林冲被人诬陷后,沦落至看守草料场境地的故事。里面描写风雪的话语十分简单,一句话“那雪下的正紧”,背景就全部交代清楚了。而这一句简简单单的描写,却获得了巨大的成功。清代著名的学者金圣叹批点道:“写雪绝妙。”鲁迅先生赞扬它富有“神韵”。而这句话也正是因为简单,所以被很多人记住,流传至今。

    无独有偶,美国著名的儿童文学家、教育学家苏斯博士一生创作了大量的精彩教育绘本,他的畅销书《绿鸡蛋和火腿》,只用了50个词,并且除了anywhere之外,全部都是单音节词。他的第二畅销书《戴帽子的猫》,也只用了220个不同的单词。这些作品虽然用词十分的简单,但是却蕴涵着先进的人文精神和教育理念,引起了巨大的反响,获得了巨大的成功,在美国童书畅销书排行榜上长期位居前列。

    当然,不光是小朋友们喜欢简单,“喜欢简单”原本就是人性使然,人的大脑原本就更倾向于去读那些通俗易懂的语句。而与之相应的,那些阅读难度越低的作品也就越容易流传。有很多十分艰涩的文学作品,即便是老师留下的课外作业,我们往往也会因为读不下去,而选择放弃。

    作者本·布拉特对1960年至今荣登《纽约时报》畅销榜的563部作品进行了统计分析,结果显示这些作品的复杂度在过去的50年里,持续下降,人们越来越喜欢那些简单的作品。

    在中国,虽然没有类似的统计结果,但是对于喜欢写作的我们来说,追求简单比推崇复杂显然更加的现实,也更容易被大多数的人接受。

    文学创作是一门艺术,但同时也是一门科学。在科学面前,只有遵循规律,才会有所成就。在《 纳博科夫最喜欢的词》这本书中,作者本·布拉特就通过大数据对文字进行分析,给我们展示出了文字背后的规律。这其中主要包括在创作的时候要谨慎的使用修饰性副词、要通过大胆的模仿去打造属于自己的风格指纹、让自己的作品足够简单才会带来成功等等。用大数据的视角去观察文字,不仅对于我们学习写作大有用处,而且也会增加我们看待世界的维度。这会让我们的人生增加另一种可能,从而可以使得我们比其他人更加的接近成功。

    相关文章

      网友评论

          本文标题:大数据视角下,1500部文学作品告诉我们的创作规律

          本文链接:https://www.haomeiwen.com/subject/rqtugqtx.html