提出起因
- Chomsky 短语结构语法生成能力太强,产生许多不符合语法或有歧义的句子;
- 标记十分简单,分析能力有限,难以反映自然语言的复杂特性。
FUG 对短语结构语法的改进
- 采用复杂特征集来描述词、句法规则、语义信息,以及句子的结构功能。
试图以单一形式的结构模式来描述特征组合、功能分配、词条和组成成分的顺序,以达到对句子的完全功能描述。 - 采用合一运算对复杂特征集进行运算。
复杂特征集
1. 复杂特征集功能描述的定义
设为一个功能描述 (Functional Description),当且仅当可以表示为:
其中,表示特征名,表示特征值,且满足以下两个条件:
(1) 特征名为原子,特征值为原子或另一个功能描述;
(2) ,读作:复杂特征集中,特征的值等于 。
2. 可以用复杂特征集描述词汇
在词典中单词的特征可以包括词类、形态、句法和语义等多方面的信息,如:
3. 可以用复杂特征集描述规则
4. 可以用复杂特征集描述句子
句子:
We helped her.
5. 复杂特征集的特点
(1) 允许利用多个特征描述同一个语言单位;
(2) 从结构上看,复杂特征集是一种嵌套结构,可以有效地表示复杂词组或句子结构;
(3) 特征名的定义及其相互关系具有明显的层次性,而所有自然语言的结构都是层次性的,复杂特征集的这一特点显然对语言的层次分析有益;
(4)复杂特征集便于运算,两个复杂特征集通过合一运算可以产生另一个复杂特征集,这与句法分析中词组和句子的产生是一致的。
合一运算
1. 复杂特征集相容的定义
若均为复杂特征集, 则是相容的, 当且仅当:
(1) 如果,且都是原子,那么是相容的,当且仅当;
(2) 如果 均为复杂特征集,是相容的,当且仅当 相容。
2. 合一运算的递归定义
(1) 在都是原子的情况下,如果,则, 否则;
(2) 如果均为复杂特征集,则
(a) 若,但 的值未经定义,则属于;
(b) 若,但 的值未经定义,则属于;
(c) 若,但,且与 相容(不相抵触),则 属于,否则,。
合一运算的作用
(1) 合并原有的特征信息,构造新的特征结构;
(2) 检查特征的相容性和规则执行的前提条件是否满足,如果参与合一的特征相冲突,就立即宣布合一失败。
网友评论