美文网首页NLP
自然语言处理——8.2 功能合一文法(Function Unif

自然语言处理——8.2 功能合一文法(Function Unif

作者: SpareNoEfforts | 来源:发表于2018-10-09 10:04 被阅读51次

    提出起因

    • Chomsky 短语结构语法生成能力太强,产生许多不符合语法或有歧义的句子;
    • 标记十分简单,分析能力有限,难以反映自然语言的复杂特性。

    FUG 对短语结构语法的改进

    • 采用复杂特征集来描述词、句法规则、语义信息,以及句子的结构功能。
      试图以单一形式的结构模式来描述特征组合、功能分配、词条和组成成分的顺序,以达到对句子的完全功能描述。
    • 采用合一运算对复杂特征集进行运算。

    复杂特征集

    1. 复杂特征集功能描述的定义

    \alpha为一个功能描述FD (Functional Description),当且仅当\alpha可以表示为:
    \left( {\begin{array}{*{20}{c}} {{f_1} = {v_1}}\\ {{f_2} = {v_2}}\\ {...}\\ {{f_n} = {v_n}} \end{array}} \right)n \ge 1

    其中,f_i表示特征名,v_i表示特征值,且满足以下两个条件:
    (1) 特征名f_i为原子,特征值v_i为原子或另一个功能描述;
    (2) \alpha(f_i) = v_i(i=1, …, n),读作:复杂特征集\alpha中,特征f_i的值等于v_i

    2. 可以用复杂特征集描述词汇

    在词典中单词的特征可以包括词类、形态、句法和语义等多方面的信息,如:

    \left( {\begin{array}{*{20}{c}} {Cat = N}\\ {Sem = Equipment}\\ {Lex = 计算机} \end{array}} \right)

    \left( {\begin{array}{*{20}{c}} {{\rm{Cat }} = {\rm{Verb}}}\\ {{\rm{Tense}} = {\rm{Past}}}\\ {{\rm{Transitivity}} = {\rm{Mental - Process}}}\\ {{\rm{Root}} = {\rm{see}}}\\ {{\rm{Lex}} = {\rm{saw}}} \end{array}} \right)

    3. 可以用复杂特征集描述规则

    \left( {\begin{array}{*{20}{c}} {S \to NP + V{\rm{erb}}}\\ {Cat = S}\\ {{\rm{Subject}} = [Cat = NP]}\\ {{\rm{Predicator = }}\left( {\begin{array}{*{20}{c}} {Cat = Verb}\\ {{\rm{Number = < Subject Number > }}}\\ {{\rm{Person = < Subject Person > }}} \end{array}} \right)} \end{array}} \right)

    4. 可以用复杂特征集描述句子

    句子:
    We helped her.

    \left( {\begin{array}{*{20}{c}} {Cat = S}\\ {{\rm{Subject}} = \left( {\begin{array}{*{20}{c}} {{\rm{Cat = Pron}}}\\ {{\rm{Number = Plur}}}\\ {{\rm{Person = First}}}\\ {{\rm{Lex = we}}} \end{array}} \right)}\\ {{\rm{Objective}} = \left( {\begin{array}{*{20}{c}} {{\rm{Cat = Pron}}}\\ {{\rm{Number = Sing}}}\\ {{\rm{Person = Third}}}\\ {{\rm{Lex = her}}} \end{array}} \right)}\\ {{\rm{Predicator = }}\left( {\begin{array}{*{20}{c}} {Cat = Verb}\\ {{\rm{Lex = help}}} \end{array}} \right)}\\ {{\rm{Tense = Past}}}\\ {{\rm{Voice = Active}}} \end{array}} \right)

    5. 复杂特征集的特点

    (1) 允许利用多个特征描述同一个语言单位;
    (2) 从结构上看,复杂特征集是一种嵌套结构,可以有效地表示复杂词组或句子结构;
    (3) 特征名的定义及其相互关系具有明显的层次性,而所有自然语言的结构都是层次性的,复杂特征集的这一特点显然对语言的层次分析有益;
    (4)复杂特征集便于运算,两个复杂特征集通过合一运算可以产生另一个复杂特征集,这与句法分析中词组和句子的产生是一致的。

    合一运算

    1. 复杂特征集相容的定义

    \alpha、\beta均为复杂特征集, 则\alpha、\beta是相容的, 当且仅当:
    (1) 如果\alpha(f ) = a、\alpha(f ) = b,且a、b都是原子,那么\alpha、\beta是相容的,当且仅当a=b
    (2) 如果\alpha(f ) 、\alpha(f ) 均为复杂特征集,a、b是相容的,当且仅当\alpha(f ) 、\alpha(f ) 相容。

    2. 合一运算的递归定义

    (1) 在a、b都是原子的情况下,如果a=b,则a \cup b= a, 否则a \cup b= \emptyset
    (2) 如果\alpha、\beta均为复杂特征集,则
     (a) 若\alpha(f ) = v,但\beta(f ) 的值未经定义,则f = v属于\alpha \cup \beta;
     (b) 若\beta(f ) = v,但\alpha(f ) 的值未经定义,则f = v属于\alpha \cup \beta;
     (c) 若\alpha(f ) = v_1,但\beta(f ) = v_2,且v_1v_2 相容(不相抵触),则f= (v_1 \cup v_2) 属于\alpha \cup \beta,否则,\alpha \cup \beta= \emptyset

    合一运算的作用
    (1) 合并原有的特征信息,构造新的特征结构;
    (2) 检查特征的相容性和规则执行的前提条件是否满足,如果参与合一的特征相冲突,就立即宣布合一失败。

    相关文章

      网友评论

        本文标题:自然语言处理——8.2 功能合一文法(Function Unif

        本文链接:https://www.haomeiwen.com/subject/kqfeaftx.html