美文网首页
Transition-based Directed Graph

Transition-based Directed Graph

作者: 一个迷人的昵称 | 来源:发表于2021-12-13 11:20 被阅读0次

Transition-based Directed Graph Construction for Emotion-Cause Pair Extraction

基础介绍

  • 本文工作:将ECPE问题转为一个有向图构建的过程
  • 本文贡献:
    1. 将端到端转为有向图构建
    2. 联合学习框架,线性复杂度
    3. 新sota
  • 任务定义:与上面内容相同

方案方法

  1. 构建有向图
  2. 特征表示

构建

G=(V,R)为有标签有向图(edge-labeled directed graph),其中,

  • V=\{1,2,...,n\}:节点集合,输入文本的子句
  • R=V\stackrel{R}{\longrightarrow}V:set of labeled edges

head node i\in{V}modifier node j\in{V}构建关系:i\stackrel{l}{\longrightarrow}j,其中l\in\{l_t, l_n\},其中,

  • l_t表示:node iemotion node j的原因(cause)
  • l_n表示:node i不是emotion node j的原因

是故,

  • 在最终结果中,一个节点可以没有任何边
  • 一个节点可以同时作为emotion nodecause node
  • 一个emotion node可以同时与多个cause node产生关系

至此,提出构建图的方法: a novel transition-based parser

parser由S表示,S=(\sigma, \beta, E, C, R),其中,

  • \sigma:已处理节点的索引
  • \beta:未处理节点的索引
  • E:set of emotions
  • C:set of causes
  • R:存储当前已生成的边

\Rightarrow action List A

论文定义了六种action(来源于观察经验):

image.png

其中,i表示stackbufferaction的元素索引。例如stack的top2个元素可以表示为:\sigma|\sigma_1|\sigma_2

具体来描述即:

  • SHIFT(SH): pop \beta_0并将其压入\sigma顶;当且仅当\beta非空
  • RIGHT-ARC_{l_t} (RA_{l_t}): 从\sigma_1\sigma_0 分配一个标签为l_t的边,即:\sigma_1 \stackrel{l_t}{\longrightarrow}\sigma_0,然后将\sigma_0 复制到E,并从\sigma pop\sigma_1到C
  • LEFT-ARC_{l_t} (LA_{l_t}): 从\sigma_0\sigma_1 分配一个标签为l_t的边,即:\sigma_0 \stackrel{l_t}{\longrightarrow}\sigma_1,然后将\sigma_1 复制到E,并从\sigma pop\sigma_0到C
  • RIGHT-ARC_{l_n} (RA_{l_n}): 从\sigma_1\sigma_0 添加一个标签为l_n的关系,即:\sigma_1 \stackrel{l_n}{\longrightarrow}\sigma_0;然后从\sigma pop\sigma_1仅复制\sigma_0到E
  • LEFT-ARC_{l_n} (LA_{l_n}): 表示\sigma_0\sigma_1的关系l_n复制\sigma_1到E;注:由于\sigma_0可能是\beta中入栈节点的原因,移动\beta_0\sigma顶 好于pop\sigma_0
  • CYCLE-ARC (CA): 对\sigma_0节点分配一个标签l_t复制\sigma_0到E、C

一些约束:

  • RIGHT-*、LEFT-*,必须在\sigma至少有两个元素时
  • \sigma|\sigma_1|\sigma_2都是emotion但是没有emotion cause时,将倾向于RIGHT-ARC_{l_n} (RA_{l_n})
  • CYCLE-ARC容易产生冲突,因此与其它action不同,(对此)训练一个基于\sigma_0表示的二分类模型

\Rightarrow 此处给出一个例子,从初始的([], [1,2,3], \varnothing, \varnothing, \varnothing)到最终的([..., \], [], E, C, R)$,有文本:

image.png

可以有以下推导过程:

image.png

\Rightarrow Search Algorithm

对于本任务,可以定义:

  • input:d_1^n=(c_1, c_2, ..., c_n)
  • output: A_1^m=(a_1, a_2, ..., a_m)

因此,可以表示为对子句d_1^n寻找合适的action序列A^*A*=argmax_A p(A_1^m|d_1^n)

对于t时刻,模型的预测与当前的system state S_taction history A_1^{t-1}有关,是故:

image.png

其中a_tt时刻生成的action,S_(t+1)是根据a_t更新的system state

r_t表示t时刻的计算action a_t的表示,有:

image.png

其中,\mathcal{A}表示在给定当前parser state下合法的action,最终有:

image.png

相关文章

网友评论

      本文标题:Transition-based Directed Graph

      本文链接:https://www.haomeiwen.com/subject/hrsjfrtx.html