美文网首页
论文阅读-Learning Span-Level Interac

论文阅读-Learning Span-Level Interac

作者: WritingHere | 来源:发表于2021-08-05 17:28 被阅读0次

    Learning Span-Level Interactions for Aspect Sentiment Triplet Extraction

    作者 & 机构:
    Lu Xu^{1,2}, Yew Ken Chi^{1,2}, Lidong Bin^2
    ^1Singapore University of Technology and Design2DAMO Academy, ^2Alibaba Group

    链接 : [https://aclanthology.org/2021.acl-long.367.pdf]

    研究主题

    • Category (General) : 信息抽取
    • Category (Specific) : 观点情绪挖掘

    文章总结(What)

    本文使用基于span的方法来进行ASTE(Aspect Sentiment Triplet Extraction,方面情感三元组抽取),使用span的好处是可以实现观点词和目标词的整体的交互,从而更好地识别情感。

    解决的主要问题(Why)

    以往的模型使用的是word-word级别的交互,这可能对关系判断造成误导,作者使用span级别的交互,从整体考虑,从而避免了这一问题。

    详细信息(How)

    方法论

    20210805_1.png

    模型总体流程如上图所示,先枚举span,然后对span进行判断是否有效,做一个剪枝,然后两两组合,得到span的表示,最后判断正负极性。
    可以学习的点有:

    1. 强调剪枝操作
      先判断一个span是否是target 或者 opinion,
      P(m|s_{i,j}) = softmax(FFNNm(s_{i,j}))
      然后选择target和opinion中得分靠前的若干个span作为候选,
      \Phi(target(s_{i,j})) = P(m=target|s_{i,j})
      \Phi(opinion(s_{i,j})) = P(m=opinion|s_{i,j})
      作者把这个叫做dual channel span purning

    2. pair的表示
      g_{s^t_{a,b},s^o_{c,d}}= [s^t_{a,b};s^o_{c,d};f_{distance}(a, b, c, d)]
      pair的表示中,加上了两个span的disance,其中distance=min(|b - c|, |a - d|)

    实验与分析

    实验结果
    1. 首先肯定是主实验达到了SOTA的
    2. 单独比较ATE和OTE的抽取效果,分别在两个子任务上达到了SOTA
    3. 然后,为了呼应开头,作者说使用span的方法可以弥补word-word的一些缺陷,例如"not good", "food", 结果应该是(food, not good, negative),然后使用word-word级别的图的话,food和good以及not分别交互,从而可能将三元组判断为postitive。因此,作者说span级别可以整体交互,从而效果更好。因此,作者着重开展了相关实验,分别统计了single-word和multi-word的效果,可以发现multi-word的效果提升更为明显。除此之外,作者还开展了更为详细的实验,分别计算opinion和target中multi-word的得分,作者发现当opinion中含有multi-word的时候,效果更差,可能是数据不均衡的原因。
    4. 剪枝效果,作者又比较了剪枝的效果,即不同的剪枝策略的影响。关于双通道,单通道这里还没看明白,还需要研究。
    5. 定性分析,也就是case study了,作者举了一个例子,说明了span based方法的效果,尤其是针对multi-word方面。
    6. 消融实验,作者分析了在span表示和关系表示中是否考虑pooling信息,distance等的影响。

    未来展望

    暂无

    其他

    相关文章

      网友评论

          本文标题:论文阅读-Learning Span-Level Interac

          本文链接:https://www.haomeiwen.com/subject/xvzmvltx.html