阿里专场，6位分享嘉宾，ACL 2020 系列论文解读火力全开！

作者: AI研习社 | 来源:发表于2020-07-08 11:33 被阅读0次

阿里专场，6位分享嘉宾，ACL 2020 系列论文解读火力全开！
2020-06-18
2020奋斗新时代
底线已被触碰
ACL2020论文分享：基于层次感知的全局模型进行层级性文本分类
ACL2020论文分享：一种新颖的级联二分类标注框架进行实体三元
火力全开
火力全开
火力全开
火力全开

image

2017年 10 月 11 日，阿里巴巴达摩院正式成立，马云的一句 “ 活得要比阿里巴巴长”，让外界对它的未来发展，有了更 “意味深长” 的期待。

在近三年多的时间里，达摩院在人工智能学术科研与应用上齐头并进，无论在国际学术顶会以及各类竞赛上，还是在推动学术成果的商业化落地上，都交出了亮眼的成绩单，这也反过来吸引着人工智能领域的顶尖研究者们都汇聚于此。

对于这些顶尖研究者们目前正在开展的研究工作，想必大家都充满了探知欲！

7月9日（晚）19:30-21:00，AI科技评论就将联合阿里达摩院，外加阿里集团在学术科研上同样“坚挺”的存在——阿里安全，给大家呈上一场“ACL 2020 系列论文解读·阿里巴巴专场”直播！

届时，来自阿里达摩院机器智能技术团队和阿里安全安全智能团队的 6 位高级算法专家、算法工程师以及研究型实习生们，将分别聚焦于多任务学习、少样本文本分类、任务型对话、神经机器翻译、知识蒸馏、跨域分词标注等NLP 细分领域，为大家带来一场论文解读盛宴！

本次分享的嘉宾具体都有谁呢？下面一一揭晓：****分享主题：SpanMlt：一种基于跨度的用于属性词和观点词配对抽取的多任务学习框架 ****分享嘉宾：黄龙涛

image

分享内容：

属性词和观点词抽取，是细粒度的基于属性的情感分析（ABSA）的两个关键问题。属性－观点词对（ aspect-opinion pairs）可以为消费者和观点挖掘系统提供相关产品或服务的全局配置文件。但是，传统方法无法在没有给定属性词和观点词的情况下，直接输出属性－观点词对。尽管研究者最近提出了一些共提取方法来联合提取属性词和观点词，但是并不能配对抽取两者。为此，本文提出了一种端到端方法来解决属性词和观点词的配对抽取（PAOTE）任务。此外，本文从联合词和关系抽取的角度而非此前大多数工作中执行的序列标注方法的角度，来处理该问题。我们提出了一个基于共享跨度的多任务学习框架，其中在跨度边界的监督下提取词。同时，使用跨度表示法来联合识别配对关系。大量实验表明，我们的模型始终优于 SOTA 方法。

****分享主题：基于动态记忆归纳网络的少样本文本分类******分享嘉宾：耿瑞莹**

image

分享内容：

现有的工作往往使用元学习（meta learning）的方法，通过在一系列meta-task中切换来获得少样本学习的能力，但是在task间的切换会带来遗忘的问题，因此考虑使用记忆机制来辅助meta learning的训练。在本工作中，我们将监督学习得到的分类参数作为meta learning的全局记忆，并提出了动态记忆路由算法，基于dynamic routing的方式将全局记忆信息融入到meta task的训练和预测阶段。此外，动态记忆路由算法还可以使用query信息来增强归纳类别表示的能力，对口语场景下的语言多样性表达有更好的泛化性能。在中英文场景少样本分类任务数据集上，均取得了STOA的结果。

分享主题：多领域对话动作和回复联合生成****分享嘉宾：田俊峰

image

分享内容：
在任务型对话中，产生流畅且信息丰富的回复至关重要。现有pipeline方法通常先预测多个对话动作，然后使用它们的全局表示来辅助回复生成。这种方法有两个缺陷：第一，在预测对话动作时，多领域的固有结构被忽略了；其次，在生成回复时没有考虑到对话动作和回复之间的语义联系。为了解决这些问题，我们提出了一种同时生成对话动作和回复的神经联合生成模型。与以往的方法不同，我们的对话动作生成模块可以保留多领域对话动作的层次结构，同时我们的回复生成模块可以动态地关注到相关的对话动作。在训练时，我们采用不确定性损失函数来自适应地调整两个任务的权重。在大规模MultiWOZ数据集上进行了评估，实验结果表明，我们的模型在自动评估和人工评估上都比SOTA模型有很好的提升。****分享主题：神经机器翻译的多尺度协同深度模型******分享嘉宾：魏相鹏**

image 分享内容：

近年来，神经机器翻译(NMT)方法凭借其出色的翻译性能在大量应用场景中取代了基于统计的机器翻译方法。目前，制约NMT模型性能的因素主要包括模型的特征表达能力和数据规模。因此，我们提出一种基于多尺度协作(MSC)机制的深度神经机器翻译模型，以提高模型对底层（具象化）和高层（抽象化）特征的建模能力。

实验证明，(1) 多尺度协作机制有助于构建极深的NMT模型的同时带来性能上的提升，(2) 基于MSC机制的深度NMT模型能够更好地翻译语义结构复杂的自然语言句子。

****分享主题：多语种序列标注的结构级知识蒸馏******分享嘉宾：王新宇**

image 分享内容：

多语言序列标注是一项使用单一统一模型预测多语言标签序列的任务。与依赖于多个单语模型相比，使用多语言模型具有模型规模小、在线服务容易和对低资源语言通用的优点。然而，由于模型容量的限制，目前的多语种模型仍然远远低于单独的单语模型。本文提出将多个单语言模型（teachers）的结构知识提取到统一的多语言模型（student）中，以缩小单语言模型与统一的多语言模型之间的差距。我们提出了两种基于结构层次信息的知识挖掘方法：

近似地最小化students 和teachers的结构层次概率分布之间的距离；
将结构层次知识聚合为局部分布，并最小化两个局部概率分布之间的距离。我们对4个多语言任务和25个数据集的实验表明，我们的方法优于几种强大的baseline方法，并且比baseline模型和teacher模型具有更强的零样本概化能力。

****分享主题：跨域中文分词的远程标注与对抗耦合训练******分享嘉宾：丁宁**

image 分享内容：

完全监督神经方法在中文分词（CWS）的任务上取得了重大进展。但是，如果由于域间的分布差异和集外词（OOV）问题导致域迁移，则监督模型的性能始终一直大幅下降。为了实时缓解此问题，本文将跨域中文分词的远程标注和对抗性训练直观地结合在一起。

我们重新思考了“中文分词”的本质，并设计了一种自动远程标注机制，该机制不需要目标域上的任何监督或预定义词典。该方法可以有效地探索特定域的分词并远程标注目标域的原始文本。
我们进一步开发了句子级别的对抗训练程序，以实现降噪和最大化地利用源域信息。在跨多个领域的多个真实世界数据集上进行的实验表明，我们的模型所具有优越性和鲁棒性，大大优于此前的SOTA 跨域中文分词方法。

7月9日，6位来自阿里的分享嘉宾，与大家不见不散！