由于内容过多,分了三个部分,下面是其中第二部分:
第二部分
《新华字典》是中国第一部按照汉语拼音排序的语文工具书。
你有没有注意过,正文第一页前,《新华字典》还有100多页,主要是检字表。它既包括“汉语拼音音节索引”,也包括“部首检字表”。
同样体量的英文小词典,正文前面不会超过10页。为什么有这么大差别?因为汉语的检索特别难,简直是个千古难题。比拼音文字难度高好几个数量级。拼音文字,就比如说英语,26个字母能拼出所有的词,检索非常简单。
由于汉字的特点,它是全世界唯一仍然被广泛使用的语素文字。我们的文字最小单位通常是一个字,字既表音,也表形、表意,这就造成了中文的最小单位比英文大了好几个数量级。从古到今,汉字的总数量,大约在10万左右,覆盖日常使用99.48%的常用汉字,也要3500个。而最新版《新华字典》的收字数量是13000多。
这么多字收进字典,马上就涉及如何查找定位的问题。解决搜索问题的算法,包括顺序查找、排序算法和分类算法。这么多的字,肯定不能用顺序查找,也就是为查一个字,把几百页的字典挨个翻一遍。这就得考虑先用某种方法排序。
《新华字典》是中国第一部按照汉语拼音排序的语文工具书。
那它之前的中文字典是怎么排序的呢?
1、部首排序
最主流的是部首排序《说文解字》,它第一次根据汉字的形体特点,用部首来排序。许慎首创了汉字搜索的分类算法,先把字按照部首分类,比挨个数大大提高了搜索效率。但《说文解字》的540个部首本身的排序,并没有什么规则,所以,一个字光是找到它在目录里的位置,也很花时间。
《康熙字典》就进步多了,部首是按照笔画多少排序的,等于说综合运用了分类算法、排序算法和顺序查找。《新华字典》也沿用了《康熙字典》的部首检字法,正文前面那100多页,主要就是部首检字表,而且,现在我们已经把部首归纳简化为201个了。但查找起来依然要好几步,不光是查起来很繁琐,而且有些字,判断部首很费劲。
2、拼音排序
按照部首分类查这么费劲,还有没有更好的办法?像英文一样,按照读音来排序呢?
现在咱们用的《新华字典》,就是按照汉语拼音字母顺序排列的。一个字,只要你会用标准普通话读,很容易就根据字母顺序确定它的位置。走到这一步,我们中国人有多难,甚至比部首检字法更难。
首先,中国古代没有拼音,给字注音长久以来都是借助别的汉字,直到19世纪末西方现代语言学的引入,才加快了汉语注音问题的解决。1908年出现了注音字母。(注意,不是汉语拼音,它们不是你熟悉的拉丁字母,而是用汉字的偏旁部首改造的)1953年第一版《新华字典》,就是用这种方法注音,也是按照注音字母来排序的。就算是今天的《新华字典》里,每个字的汉语拼音旁边,也保留了注音字母。而我们今天人人都会的汉语拼音,则是又过了半个世纪,1958年才正式定型公布的。
《新华字典》的反应有多快?1959年5月出的字典,就迅速按照汉语拼音字母顺序,重新排了版。
但是,先别急着赞叹,字典改排顺序,虽然流程很繁琐,毕竟只是个机械工作,要真正能让更多人用上拼音检字法,还意味着一个超大型工程——推广普通话,也就是咱们的民族共同语。要知道中国有七大方言区,每个方言区,语音、词汇、语法都有差别,尤其是很多南方地区,一个县之内就有四五种互相无法交流的方言。这可不是国家发一版汉语拼音方案,老百姓就立刻能说普通话的。中国是又花了60多年的时间,才把普通话的普及率提高到了80%。
当然,国家推广普通话,可不只是为了方便大家查字典的。
农业社会,人的活动交往范围小,会说本地话就足够了,只有出去做官的人,才需要说官话。但到现代社会,随着人口流动的增加、人际交往的扩大,说着不同方言、不同语言的人打交道越来越多。美国学者乔纳森·普尔研究了133个国家的数据,他的结论是,语言的相对统一跟经济发展有正相关关系。
同时,在任何一个多民族、多语言、多方言的国家,民族通用语的作用,也不只是方便交际,还会指向身份认同。
这是从大的方面来讲,具体到个人,也是如此。且不说当老师、考公务员普通话得过关,甚至我看过报道,调研北京农民工的情况,发现普通话熟练的人,比那些不熟练的,月收入能高出2-4成。所以,推广普通话,既是社会发展和民族认同的需要,同时也是个人发展的需要。这么一个国家系统工程,需要从教育、出版、传媒多个方向发力。
那《新华字典》又是怎么把自己嵌入这个系统工程里的呢?它不光是迅速把字典改成按汉语拼音音序排列,方便人根据读音快速给字定位,而且,立刻采用汉语拼音方案给汉字注音,提供了正音的标准。尤其重要的是,在广播电视这些有声传媒不发达的年代,跟着《新华字典》的拼音学普通话,大概是成本最低的方案了。一个发展中的大国,这个账不能不算。
采用汉语拼音注音排序,《新华字典》解决的不仅仅是自身检索难的问题,更是为普通话的推广立下了汗马功劳。随着基础教育的普及,中国人对《新华字典》的需求量也越来越大。
网友评论