书中小结:
- 通信的原理和信息传播的模型
- (信源)编码和最短编码
- 解码的规则、语法
- 聚类
- 校验位
- 双语对照文本、语料库和机器翻译
- 多义性和利用上下文消除歧义性
本文主要内容分为三个小结:信息,文字和数学,文字和语言背后的数字顺序进行展开。
感觉就是人类语言的一个发展简史,从无到有,有多到少,从复杂到简化的一个过程。而作者也是借此提到了现代自然语言处理过程发展也是在借鉴如此过程,从语言发展过程的的重要问题解决方法,同样可适用于自然语言处理发展过程的相似重要问题,而且解决问题的结果也有相似。
网友评论