论文阅读-Learning Span-Level Interac

作者: WritingHere | 来源:发表于2021-08-05 17:28 被阅读0次

Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction

作者 & 机构:
Lu Xu $^{1,2}$ , Yew Ken Chi $^{1,2}$ , Lidong Bin $^2$
$^1$ Singapore University of Technology and Design2DAMO Academy, $^2$ Alibaba Group

链接 : [https://aclanthology.org/2021.acl-long.367.pdf]

研究主题

Category (General) : 信息抽取
Category (Specific) : 观点情绪挖掘

文章总结(What)

本文使用基于span的方法来进行ASTE(Aspect Sentiment Triplet Extraction，方面情感三元组抽取)，使用span的好处是可以实现观点词和目标词的整体的交互，从而更好地识别情感。

解决的主要问题(Why)

以往的模型使用的是word-word级别的交互，这可能对关系判断造成误导，作者使用span级别的交互，从整体考虑，从而避免了这一问题。

详细信息(How)

方法论

20210805_1.png

模型总体流程如上图所示，先枚举span，然后对span进行判断是否有效，做一个剪枝，然后两两组合，得到span的表示，最后判断正负极性。
可以学习的点有：

强调剪枝操作
先判断一个span是否是target 或者 opinion，
$P(m|s_{i,j}) = softmax(FFNNm(s_{i,j}))$
然后选择target和opinion中得分靠前的若干个span作为候选，
$\Phi(target(s_{i,j})) = P(m=target|s_{i,j})$
$\Phi(opinion(s_{i,j})) = P(m=opinion|s_{i,j})$
作者把这个叫做dual channel span purning
pair的表示
$g_{s^t_{a,b},s^o_{c,d}}= [s^t_{a,b};s^o_{c,d};f_{distance}(a, b, c, d)]$
pair的表示中，加上了两个span的disance，其中 $distance=min(|b - c|, |a - d|)$

实验与分析

实验结果

首先肯定是主实验达到了SOTA的
单独比较ATE和OTE的抽取效果，分别在两个子任务上达到了SOTA
然后，为了呼应开头，作者说使用span的方法可以弥补word-word的一些缺陷，例如"not good", "food", 结果应该是(food, not good, negative),然后使用word-word级别的图的话，food和good以及not分别交互，从而可能将三元组判断为postitive。因此，作者说span级别可以整体交互，从而效果更好。因此，作者着重开展了相关实验，分别统计了single-word和multi-word的效果，可以发现multi-word的效果提升更为明显。除此之外，作者还开展了更为详细的实验，分别计算opinion和target中multi-word的得分，作者发现当opinion中含有multi-word的时候，效果更差，可能是数据不均衡的原因。
剪枝效果，作者又比较了剪枝的效果，即不同的剪枝策略的影响。关于双通道，单通道这里还没看明白，还需要研究。
定性分析，也就是case study了，作者举了一个例子，说明了span based方法的效果，尤其是针对multi-word方面。
消融实验，作者分析了在span表示和关系表示中是否考虑pooling信息，distance等的影响。

未来展望

暂无

其他

源码: [https://github.com/chiayewken/Span-ASTE]

网友评论

本文标题：论文阅读-Learning Span-Level Interac

本文链接：https://www.haomeiwen.com/subject/xvzmvltx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！