上图就是大名鼎鼎的莫尔斯码,是由电报的发明人塞缪尔·莫尔斯在1836年发明出来的,为的是解决用电信号传输英语字母信息的问题。
现在电报已经远离了我们,所以就更少接触莫尔斯码了,但是当我们看到很多如《暗算》、《听风》之类的谍战剧如时,总是看到里面的谍报人员躲在一个阴暗的地方,不停地按击着一个小小的装置,发出嘀嘀嗒嗒的声音,其实他们发送的都是莫尔斯码。
简单来讲,在电报机中,“嘀”就是开关的短暂接触,在图中用点表示;“嗒”就是长时间接触(一般是嘀的三倍时长),在图中用线段来表示。
假设我们用0代表“嘀”(也就是点),1代表“嗒”(也就是线段),例如图中的M用莫尔斯码表示就是“11”。如果用电报发送“HELLO, WORLD”给别人,那么莫尔斯码就表示为“ 0000 0 0100 0100 111 011 111 010 0100 100”。
这里面我们发现了一个很奇怪的现象,第二个字母“E”,仅仅用了一位“0”来表示,而H和L,都用了4位数字来表示。
这是为什么呢?在信息论中定义,要将最短的编码分配给最常用的字母。英语中最长用的字母就是“E”,所以仅仅用了一位“0”,第二常用的就是“I”,用了两位“00”,其余字母有三位,有四位,而到了数字就用了五位。
信息论是所有网络通讯最基础的理论,其中一部分内容用最简单的一句话表述就是“用最小的代价,把握出现频率最高的信息”。
汉语中常用字只有三千多个,中国国家标准GB2312-80《信息交换用汉字编码字符集*基本集》制订的根据就是汉字使用频率。其中一级字库为3755个常用字,二级字库为3008个不常用字。一级字库的字,使用频率合计达99.7%,而最常用的1000个汉字,使用频率在90%以上。而最高频出现字的排序如下:
一、使用频率排名前5个汉字(使用频率之和为10%):的 一 是 了 我
二、使用频率排名第(6~17)个汉字(使用频率之和为10%):不 人 在 他 有 这 个 上 们 来 到 时
三、使用频率排名第(18~42)个汉字(使用频率之和为10%):大 地 为 子 中 你 说 生 国 年 着 就 那 和 要 她 出 也 得 里 后 自 以 会 家
四、使用频率排名第(43~79)个汉字(使用频率之和为10%):可 下 而 过 天 去 能 对 小 多 然 于 心 学 么 之 都 好 看 起 发 当 没 成 只 如 事 把 还 用 第 样 道 想 作 种 开 (这36个汉字的使用频率之和为10%)
这79个汉字,在汉字的书写中出现的频率高达40%,他们就如同英文字母中的“E”,频繁出现在书写中。
练习毛笔书法,书写古文,最多出现的是“之乎者也矣焉哉”,古文和现代文的助词差异比较大。
练字,最科学的方法,就是从这些字开书着手练习,所谓学习有捷径,不在于练习花少时间,而是集中精力练习正确的字,少练,精炼,但是起到改变整体的效果。将这些初级常用字练到方正,练到熟练,它们会在书写的文章中起到定海神针的作用,可以让文章整体上立刻改观。
image
科学写字观和方法论
(1)卓有成效练字的探索之旅
(2)硬笔书写永字八法浅析——及如何通过刻意练习练好永字
(3)有意设计,无意书写
(4)练字与写字——读《思考,快与慢》关于写字的思考
网友评论