第一章:文字和语言vs数字和信息
这一章是《数学之美》的第一章。
与之前《浪潮之巅》不同,不是直接讲述现代科技,而是结合原始人类的历史渐渐引出语言文字的发展,并且与数字信息进行对比,并结合 “信息传输过程”、“罗萨塔石碑”、“文言文与口语”、“圣经抄写”、“莎士比亚戏剧原文”讲述了数字和语言文字有着共同的作用——传递信息。
首先说一说为什么会产生语言文字。
人们的生活经验,作为那个时代最宝贵的资源,随着社会发展越来越多,初期人们能依靠记忆,但后来,没有人能记住所有内容,于是高效、准确记录信息的方法必须产生——即是语言文字。可以想象,对于没有衍生出语言文字的物种,只能依靠基因一点点进化来增加记忆容量。我认为这是非常缓慢的,也许这也就是为什么其他物种都被人类所支配吧,毕竟他们都不具语言文字,进化是非常缓慢的。
信息传输过程
信息 | → | 信息 | → | 信息 |
---|---|---|---|---|
说话人-信息源 | (说话的声音-编码) | (信道) | (听到声音-解码) | (接受者) |
这个非常有趣,尽管经过几千年的发展,本质的原理是没有变化的。下面还要提到几个例子,比如文言文和口语。书中讲到,当时时代背景决定了每一个用物理方式记录下来的文字成本都是非常高的,所以人们惜墨如金,尽可能压缩原信息,而口语却没什么晦涩难懂。回顾历史,清代的小说像《红楼梦》很容易读懂,至于为什么会慢慢演变喃?我想也就是因为造纸术的进一步发展,降低了写字成本的原因吧。我以前总是疑惑,为什么文言文会逐步演化成白话文,今天动脑一想就明白了,并不是演化成白话文,而是本来就是白话文,演化的只是记录的文字罢了。
还有一个例子是生僻字与常用字笔画复杂度的不同。对于现在学过哈夫曼编码的我们可以轻易理解,但这一切不是很巧妙吗?那时候人肯本不懂信息论的概念,但源自身的需求自然而然就演变成了同样的方式。
下面列举两个字 : 天(tian) 鷆(tian) 这两个字都是我mac 输入法里面随便找的...
再说一下《圣经》抄写的故事。
《圣经》主要分《旧约》和《新约》(约90~100万字) ,《耶路撒冷三千年》里面讲好像《新约》是在基督圣殿经过一次毁灭之后再写成的。两部都是多人合作校订完成,大约有几个世纪。这么多年时间,肯定需要抄写前人的内容,一个不可避免的问题就是抄错。可是如何检查抄错?犹太人想了一个类似现在校验码的东西:每个字有一个hash值,把每行每列hash求和,与原文对比,看是否正确。上学期学了《计算机网络》里面也有这样一种校验方式,也许就是根据犹太人这个典故而产生的。这里我总联想起《三体》里面讲到三体星人模拟计算机运算的故事......
最后说一个罗赛塔的典故。
讲的公元七世纪,罗马、希腊都曾占领国埃及,所以留下了一篇由三种文字写成的碑文。在拿破仑铁骑来到埃及的时候,随从的百名语言学家发现并破译了碑文内容,为后世了解古埃及文明做无与伦比贡献。书中说这也是为什么现在许多翻译软件叫 罗赛塔 的原因。虽然我至今未用过一款叫 罗赛塔 的东西…
文中还夹杂着许多有趣的知识和典故,相信由很多是我的水平看不到的,希望同样看过的人能与我分享。
网友评论