依存组合语义(dependency-based compositional semantics, DCS)是由斯坦福提出的一种语义表示方法(EMNLP2013, Semantic Parsing on Freebase from Question-Answer)。
语义解析就是将原始问句转换为机器可以理解的逻辑形式,这种形式更贴近知识图谱的存储结构。
在论文中介绍了一种特殊的操作: 桥接
桥接(bridging)操作把两个独立的语义表示片段连接起来。在语义分析过程汇总,句子汇总不同片段对应的语义表示可能无法直接进行合并。为了保证语义分析能够尽量完成,需要尽可能连接这些离散的语义片段,这就是引入桥接操作的目的。当然并不是任意的两个语义片段都能够进行桥接建立联系,对于那些在知识图谱中存在谓词关联并满足类型约束条件的语义表示片,可以采用桥接操作将两者联系起来。DCS采用的三种桥接技术:
- 第一种桥接操作作用于一个一元语义表示u,将其转化为类型为t的语义表示b.u 。该操作中谓词b需要满足的条件是: 其右端的宾语实体类型必须为t
- 第二种桥接操作作用于两个类型分别为和 的一元语义表示和,将其转化为类型为 . 此操作中谓词b需要满足的条件是:其左右两端的两个实体类型必须为和 ,因为只有类型相同的两个一元语义表示才能够通过交操作进行合并。
- 第三种桥接操作作用于两个语义表示 和 , 将其转化为语义表示. 这个操作需要满足条件:
1)谓词b左右两端的两个实体类型必须为 t和;
2)u的类型必须为t;
3)谓词的类型必须是, *表示的类型
语义表示中的谓词是 Education
在输入问题: Which college did Obama go to?
中并没有显示的关系链接或关系对应。
由于Type.University对应类型是University, BarackObama 对应类型是Person,谓词Education左右两端的实体类型分别为Person和University
可以应用第二类桥接操作引入谓词Education对Type.University和BarackObama进行合并,生成类型为University的语义表示。
这里Person和University对应图谱中的两个实体,桥接操作给出了 两个实体之间可能的关系链接。
通过桥接操作可能生成不同的语义表示后续,下一步的工作就是对后续进行打分
image.png
主要考虑的特征有:
- 对齐特征
- 词汇特征
- 跳词特征
- 问题词特征
- 操作特征
参考
- 揭开知识库问答KB-QA的面纱
- 《智能问答》
网友评论