美文网首页
数学视角读《论语》

数学视角读《论语》

作者: Emerson_G | 来源:发表于2019-10-27 21:58 被阅读0次

    静心阅读几则《论语》,细细品读其字里行间的微言大义。纵然已经过去了两千四百多年,但简单质朴的文字却能够历经岁月沧桑,将当年孔夫子论道讲学、周游列国等情景大致呈现出来,让我们仍然有机会能够聆听先哲的教诲,慨叹推行仁道之艰难,感受弟子们细微的生活或心理。

    从古至今,研究批注《论语》者无数,从思想文化到语言文字可谓已经卷帙浩繁。这里,只是想从数学的视角来简单分析下《论语》, 亦或可能从不同的角度能产生一点点的新意,为有兴趣的读者提供一点点的灵感!


    image.png

    本文《论语》的版本源于https://ctext.org/analects/zh(繁体,中国哲学书电子化计划)
    原始文本及分析的源代码:https://github.com/dream-catcher/learning_blogs/tree/master/Analects_Math

    (1)说话总共多少字?

    《论语》作为古代读书人启蒙的经典,很多学子都能熟练地背诵。所以,其篇幅规模上并没有后世著作那么庞大。


    1total_count.png

    值得注意的是,论语中“说话”的次数多达764次,总字数(包括独白、对话等所有语言)统计11922字,占了全书的74.9%的比例。足见书名《论语》中的“语”字是名副其实的,整本书的确四分之三都是语言,所以我们因此称其为“语录体”吧!
    《论语》中平均每章节是31.65字,而最短的章节只有5个字,最长的章节足足有315字。
    很好奇是最短章节哪5个字独立成章呢?

    2.shortest_section.png
    可见,最短的章节是第十篇“乡党”的第九章:

    席不正,不坐。

    讲述孔子不坐不正之席,似乎与“不饮盗泉之水”有相似的含义。
    那最长的章节是什么呢?
    315字堪比现在一篇短文,古人背诵的时候是否容易?


    3.longest_section.png

    子路、曾皙、冉有、公西華侍坐。子曰:「以吾一日長乎爾,毋吾以也。居則曰:「不吾知也!』如或知爾,則何以哉?」子路率爾而對曰:「千乘之國,攝乎大國之間,加之以師旅,因之以饑饉;由也為之,比及三年,可使有勇,且知方也。」夫子哂之。「求!爾何如?」對曰:「方六七十,如五六十,求也為之,比及三年,可使足民。如其禮樂,以俟君子。」「赤!爾何如?」對曰:「非曰能之,願學焉。宗廟之事,如會同,端章甫,願為小相焉。」「點!爾何如?」鼓瑟希,鏗爾,舍瑟而作。對曰:「異乎三子者之撰。」子曰:「何傷乎?亦各言其志也。」曰:「莫春者,春服既成。冠者五六人,童子六七人,浴乎沂,風乎舞雩,詠而歸。」夫子喟然歎曰:「吾與點也!」三子者出,曾皙後。曾皙曰:「夫三子者之言何如?」子曰:「亦各言其志也已矣。」曰:「夫子何哂由也?」曰:「為國以禮,其言不讓,是故哂之。」「唯求則非邦也與?」「安見方六七十如五六十而非邦也者?」「唯赤則非邦也與?」「宗廟會同,非諸侯而何?赤也為之小,孰能為之大?」

    最长的一章正是中学课本选的课文,孔子和几个弟子坐在一起,彼此讲述平生志向。这章虽然字数略多,但前后逻辑很强,背诵起来也没有那么困难。

    (2)各篇中语言对话是怎么记述的?

    首先初步看下《论语》各篇的总字数及语言字数是如何分布的?


    5.char_dist_table.png

    而由前面汇总项统计可知,《论语》每篇平均796字。

    4.char_distribution.png

    图中蓝色代表每一篇的全部字数,黄色代表语言字数。由上图可见,大致前面10章的每章字数规模相当,而《宪问》的字数达到最高1340字。
    从语言占比(说话的字数在总体篇幅中占比)角度来看,《乡党》一篇是尤其特立独行的一篇,它的语言占比非常之低,仅有3.74%是对话或独白,可见《乡党》篇主要是叙事类的描述;而《学而》篇、《里仁》篇、《泰伯》篇的语言占比都在85%以上,属典型的语言篇,其他篇目的语言占比一般都在70%以上。

    (3)撰写论语总共使用多少不同的字?

    经简单的计数统计,我们发现论语只使用了1354个不同的字编撰而成。大大低于我们今天的常用字2500字,及常用字加次常用字3500字,更别说康熙字典的四万七千字。当然《论语》中存在部分通假字,也一定程度上导致其总使用的不同字数偏少。
    那是哪些字出现频率比较高呢?下面简单列举词频最高的40个字。
    可见,出现最多的毫无疑问是“子”字,除了大量的“子曰”之外,还有如曾子、有子、子路、子贡、子夏、子张等等。
    排在列表前面比较高频的字大多都是虚词。
    第一个包含相对具体的含义的字是“君”字(160次),主要是提及的“君子”的概念(君子共出现108次);“仁”字出现了109次,而“道”字出现了89次,“礼”字出现了75次。这些可谓是孔子和弟子们最重视的核心理念。

    [('子', 973),
    ('曰', 757),
    ('之', 613),
    ('不', 583),
    ('也', 532),
    ('而', 343),
    ('其', 270),
    ('人', 219),
    ('者', 219),
    ('以', 211),
    ('有', 200),
    ('矣', 181),
    ('於', 175),
    ('為', 170),
    ('君', 160),
    ('乎', 158),
    ('可', 156),
    ('如', 154),
    ('與', 144),
    ('無', 131),
    ('言', 130),
    ('則', 124),
    ('問', 120),
    ('知', 118),
    ('何', 118),
    ('吾', 113),
    ('仁', 109),
    ('夫', 105),
    ('道', 89),
    ('焉', 88),
    ('行', 82),
    ('謂', 78),
    ('必', 75),
    ('禮', 75),
    ('孔', 74),
    ('斯', 71),
    ('三', 70),
    ('能', 69),
    ('見', 67),
    ('學', 65)]

    下面简单画了一个词云来形象展示下:


    6.word_cloud.png
    “我”、“吾”、”予”三字使用习惯有什么差异?
    image.png

    统计出来显示论语中出现了“吾“字113,是使用次数最多的自称;其次是“我”字,共出现了53次(其中孔子弟子名字“宰我”占6次)。而“予”字只出现了28次,其中大部分是表示自称的用法,也有记录孔子的弟子“宰予”的名字(共3次)。

    (4)孔子单独言语记录占比有多高?

    我们知道《论语》主要是记录孔子及弟子言行的书籍,那么孔子独自说话的情形占比多少呢?如“子曰:「巧言令色,鮮矣仁!」”或“子曰:「溫故而知新,可以為師矣。」”。独自说话往往是格言教诲或评述人或事的内容。
    初略统计,以子曰、孔子曰开头的语言章节多达229章,占全书503章的45.5%左右。孔子单独言语的总字数多达4590字,占全书15920字的28.8%

    (5)论语中最喜欢说的数字是什么?

    古人通常最喜欢什么数字,似乎应该是一或九。如“吾道一以贯之”或屈原的“九歌”、孙子兵法的“九地”、“九变”。不过在《论语》中最喜欢提及的数字并非这两者,我们看看统计结果:

    「一」 32
    「二」 14
    「三」 70
    「四」 18
    「五」 15
    「六」 10
    「七」 6
    「八」 2
    「九」 5
    「十」 20
    「百」 17
    「千」 5
    「萬」 2
    「幾」 5

    其中,数字“三”居然出现了70次,远远高于“一”的32次,及数字“十”的20次,数字“九”仅仅出现了5次。
    看来孔子和弟子们最喜欢使用“三”作为计数,例如下:

    子曰:「詩三百,一言以蔽之,曰『思無邪』。」
    子曰:「三軍可奪帥也,匹夫不可奪志也。」
    子曰:「君子道者三,我無能焉:仁者不憂,知者不惑,勇者不懼。」子貢曰:「夫子自道也。」

    8.number_3.png

    (6)弟子中谁的言论最多?

    除了孔子之外,弟子中谁的单独言语最多呢?
    “子夏”单独的言行共计10条,而“曾子”的单独言行占9条。
    据传《论语》是孔子逝世后,由其弟子及弟子的门人在约30~50年时间内编撰而成,所以这里很可能是子夏与曾子的门人记述他们的老师的言行。
    另外值得注意的一点是:颜渊作为孔子非常欣赏的弟子,在《论语》中只有一次单独的言语记录,就是其评价孔子的学问之大,并循循善诱地教诲他。

    顏淵喟然歎曰:「仰之彌高,鑽之彌堅;瞻之在前,忽焉在後。夫子循循然善誘人,博我以文,約我以禮。欲罷不能,既竭吾才,如有所立卓爾。雖欲從之,末由也已。」

    (7)“女”字和“你”、“女性”是什么关系?

    《论语》中“女”共出现了19次,分布在15章中。在19次用法中,表示“你”(通假字“汝”)的含义占了17次,只有2次表示女性的意思。
    第十七篇《陽貨》的第25章:

    子曰:「唯女子與小人為難養也,近之則不孫,遠之則怨。」

    第十八篇《》的第4章:.

    齊人歸女樂,季桓子受之。三日不朝,孔子行。

    其余的用法均表示“你”的含义,如第六篇《雍也》第12章:

    冉求曰:「非不說子之道,力不足也。」子曰:「力不足者,中道而廢。今女畫。」

    (8)记录孔子周游列国的哪几个国家?

    孔子大约周游了几个国家:卫、曹、宋、郑、陈、蔡、楚,那么在《论语》中大概提及那些地方呢?发生在各地的故事和语言有多少?
    初步统计各个地名出现次数,其中“齐”26次,齐鲁两国相邻,自然谈及齐国的时候比较多。但只有三条记录孔子在齐国的言行或待遇:

    9.qiguo_lvxing.png

    而明显在卫国记录的故事更多:

    10.weiguo_lvxing.png

    而在陈国的经历有4条描述:

    11.chenguo_lvxing.png

    我们看下,周游至楚国又有什么记录呢?


    12.chuguo_lvxing.png

    只有一条,孔子和弟子将要去楚国,在车上听闻楚狂人的劝其归隐的歌声。
    而周游的其余国家的记录更寥寥无几,不再赘述。

    (9)在竹简上如何书写笔划繁复的“懿”字?

    根据繁体字的笔划数量统计,《论语》中出现的笔划最多的字如下列表所示,让人很疑惑当年孔门弟子是如何在竹简上刻写这些笔划繁复的文字的?这些字即使在今天发明了中性笔都感觉写起来有点费劲,古人在竹简上刻字的时候是何心情呢?这一点让人非常好奇。

    [('鑽', 27),
    ('躩', 27),
    ('驥', 26),
    ('鬭', 26),
    ('蠻', 25),
    ('讓', 24),
    ('觀', 24),
    ('籩', 24),
    ('靈', 24),
    ('變', 23),
    ('驕', 22),
    ('懿', 22),
    ('聽', 22),
    ('竊', 22),
    ('覿', 22),
    ('讀', 22),
    ('體', 22),
    ('攝', 21),
    ('鐸', 21),
    ('懼', 21),
    ('權', 21),
    ('顧', 21),
    ('儺', 21),
    ('霸', 21),
    ('耰', 21),
    ('儼', 21),
    ('譬', 20),
    ('饌', 20),
    ('繼', 20),
    ('獻', 20)]

    (10)牢是谁?

    《论语》中这个字只出现了一次,就是一个弟子的名字,记录他记住了孔子的一句话。

    牢曰:「子云,『吾不試,故藝』。」

    在《论语集注》中,朱熹解释下牢的来由,然而在《史记》的《仲尼弟子列传》并未见此人记载。

    牢,孔子弟子,姓琴,字子開,一字子張。

    让人想起司马迁在《伯夷列传》中的一番感叹:

    「雲從龍,風從虎,聖人作而萬物睹。」伯夷、叔齊雖賢,得夫子而名益彰。顏淵雖篤學,附驥尾而行益顯。巖穴之士,趣舍有時若此,類名堙滅而不稱,悲夫!閭巷之人,欲砥行立名者,非附青雲之士,惡能施于後世哉?

    牢可能只是三千弟子中寻常之人,因记住了孔子的一句话而留名于后世两千多年!

    2019年10月27日

    相关文章

      网友评论

          本文标题:数学视角读《论语》

          本文链接:https://www.haomeiwen.com/subject/uyumvctx.html