观央视诗词大会有感

作者: scvhuang | 来源:发表于2017-02-05 23:23 被阅读0次

    央视一套的诗词大会是最近朋友圈热点之一,今天也正好有朋友提到,在大数据时代,如何分辨机器写的诗和人写的诗,就这个话题聊一下想法。

    本文的结构为两部分,第一部分为机器写诗的现状,第二部分为诗词蕴含的感情如何量化。

    一,现在机器如何写诗?

    我们三步搞定:

    第一步,词和词的相关性,可以通过海量诗歌里的出现频率,tf打分,这一步可以搞定词相同的再创作,但这样写诗太明显是抄抄改改;

    第二步是通过蒙特卡洛思想刻画每个词对应的主题的概率分布,俗称lda,这样可以在同主题里换词,比如边塞诗歌落日大漠随便可以换(这个主题是最简单的),这一步写的诗达到正常人打油诗水平;

    第三步是数据挖掘必备的误差验证,例如前后情感的一致性,场景和情感的匹配性,迭代检查误差,将误差逆推回各个词去修正,也就是bp的思想。经过第三步的打磨以后,也就是现在的水平:除了没有灵魂之外,你看不出机器写的诗歌有任何问题。

    二,诗词灵魂可否量化

    ok现在我们进入本文第二部分,我如何看待诗词鉴赏的量化,以及从这个出发,机器是否可以写出诗歌的灵魂。

    让我们深吸一口气,回忆一下你上一次被感动的时刻,无论是歌曲,小说,诗歌,影视剧,会发现艺术作品的灵魂是有一种"心灵的角落被打中"的感觉,机器写的诗没有这种感觉。

    打中你的心灵的,是最高潮的那个词么?

    不是。

    诗歌的灵魂不是拆开的,离散的,而是连续的波。

    小学语文老师教的写作文先抑后扬,就是让文章蕴含的情感产生波谷和波峰。

    然而仅有波谷波峰并不能打动人。

    如果一篇作品强烈反应某种生活情景(亲情,思乡,渴望,失意),作品的波峰波谷就有可能契合到读者内心深处的波,波峰叠波峰的结果,是桥都可以震塌的共振,这就是我理解的"打中心灵的感觉"。

    写到这里,你可能会说,只要我们海量学习读者心灵的波,用多重子空间概率分布去套,是否可以让机器写出感人的诗歌?

    答案是某种程度的肯定。

    我们以网络小说举例,由于过度商业化,主人公性格和经历完全模式化,通过家人,朋友,校园,天鹅肉,被欺负到扬眉吐气等套路,去凑心灵波峰波谷,重复循环(重复的理由是不断升级,最后变成网游),这样的内容由于迎合的心灵波非常简单粗暴,对第一次读的人有一定的"感动到"的几率。

    这种水平,机器完全写的出。实际网络小说也因为快餐化和模式化,而渐渐失去了灵魂(大部分已经不是署名作者写了,或者也写不出了)。

    而传世之作的诗歌给我们的感受是什么呢?

    不以物喜,不以己悲。范仲淹的诗反过来看,就是他自己倒霉,看什么都很惨,风景蕴含的情绪,和他的情绪融为一体,整首诗含而不发地传递出"老子不在庙堂照样关心朝政,但我低调,我不说",这种情感跨越千年,仍然能打得无数(自认)怀才不遇的人心灵震荡。

    现在机器学习可以通过海量的内容,大概地知道某些主题对应某些情感,然而机器所掌握的情感还处于"这个评论是喜欢这个电饭煲还是不喜欢"的这种三岁状态,因此更高级的情感波的匹配,还是要将统计学结合回原来的人工定义各种情况的老模式,暂时靠人来弥补。

    以前我一直很困扰文明系列游戏的一个设定,一开始只有大科学家大军事家大工程师算伟人,后来引入了艺术家,我就不明白,艺术家对文明进程的贡献怎么可以和科学家相提并论?

    现在我忽然意识到,艺术大师进入的境界,是类似飞跃巅峰的高屋法子或三体3的程心一样,在逼近光速的运动里跨越万年,对光来说,时间/空间和我们的感受是不同的,范仲淹在北宋的岳阳楼和我们现在在十九大前夕的家里(而且在看央视的诗词大赛),对光来说没有任何区别。

    我们鉴赏传世诗歌的时候,在精神世界里感受到遨游于来自各个时空的波峰波谷,这种纯粹心灵世界的创造,对社会心智的启迪,足以和大科学家在理性世界所达到成就相媲美。(文明游戏是不是这样想的我不知道)

    我认为这种境界,机器最好是永远达不到,如果机器可以达到艺术大师的情感创造力,那机器也很有可能达到大科学家的理性觉醒,从而毁灭我们(然后上演互联网防火墙里的最后的人类抵抗军和墙外天网的终极对决)。

    就写到这了,我几乎不相信有人能读到这,谢谢。

    相关文章

      网友评论

        本文标题:观央视诗词大会有感

        本文链接:https://www.haomeiwen.com/subject/skkyittx.html