GLUE多任务数据集介绍

GLUE多任务数据集介绍

作者: top_小酱油 | 来源:发表于2020-03-18 10:51 被阅读0次

GLUE多任务数据集介绍
[NLP] BERT官方代码及资料
文本分类——GLUE数据集介绍
关于SDTM编程的一些想法(10)--CM
R 字符串之 glue
小白AI：VOC数据集史上最实用的介绍和使用（1）
数据集介绍
ggpubr添加组间比较参数到图中
Python数据分析与机器学习31-SVM案例:人脸识别
中文垃圾邮件分类（1）

GLUE 是一个自然语言任务集合，包括以下这些数据集

通常来说，NLP可以分为自然语言理解（NLU）和自然语言生成（NLG）。在NLU方面，我们拿时下最流行的GLUE(General Language Understanding Evaluation)排行榜举例，其上集合了九项NLU的任务，分别是

CoLA(The Corpus of Linguistic Acceptability):纽约大学发布的有关语法的数据集，该任务主要是对一个给定句子，判定其是否语法正确，因此CoLA属于单个句子的文本二分类任务；
SST(The Stanford Sentiment Treebank)，是斯坦福大学发布的一个情感分析数据集，主要针对电影评论来做情感分类，因此SST属于单个句子的文本分类任务（其中SST-2是二分类，SST-5是五分类，SST-5的情感极性区分的更细致）；
MRPC(Microsoft Research Paraphrase Corpus)，由微软发布，判断两个给定句子，是否具有相同的语义，属于句子对的文本二分类任务；
STS-B(Semantic Textual Similarity Benchmark)，主要是来自于历年SemEval中的一个任务（同时该数据集也包含在了SentEval），具体来说是用1到5的分数来表征两个句子的语义相似性，本质上是一个回归问题，但依然可以用分类的方法做，因此可以归类为句子对的文本五分类任务；
QQP(Quora Question Pairs)，是由Quora发布的两个句子是否语义一致的数据集，属于句子对的文本二分类任务；
MNLI(Multi-Genre Natural Language Inference)，同样由纽约大学发布，是一个文本蕴含的任务，在给定前提（Premise）下，需要判断假设（Hypothesis）是否成立，其中因为MNLI主打卖点是集合了许多不同领域风格的文本，因此又分为matched和mismatched两个版本的MNLI数据集，前者指训练集和测试集的数据来源一致，而后者指来源不一致。该任务属于句子对的文本三分类问题。
QNLI（Question Natural Language Inference)，其前身是SQuAD 1.0数据集，给定一个问句，需要判断给定文本中是否包含该问句的正确答案。属于句子对的文本二分类任务；
RTE(Recognizing Textual Entailment)，和MNLI类似，也是一个文本蕴含任务，不同的是MNLI是三分类，RTE只需要判断两个句子是否能够推断或对齐，属于句子对的文本二分类任务；
WNLI(Winograd Natural Language Inference)，也是一个文本蕴含任务，不过似乎GLUE上这个数据集还有些问题；

相关文章

GLUE多任务数据集介绍
GLUE 是一个自然语言任务集合，包括以下这些数据集通常来说，NLP可以分为自然语言理解（NLU）和自然语言生成...
[NLP] BERT官方代码及资料
1. 数据集介绍 1.1 GLUE数据集 GLUE数据集官网：https://gluebenchmark.com/...
文本分类——GLUE数据集介绍
通常来说，NLP可以分为自然语言理解（NLU）和自然语言生成（NLG）。在NLU方面，我们拿时下最流行的GLUE[...
关于SDTM编程的一些想法(10)--CM
前面Events数据集介绍完毕，现在开始介绍Interventions数据集。Interventions数据集主要...
R 字符串之 glue
前言今天我们要介绍的是 tidyverse 中格式化字符串的软件包：glue glue 提供了轻巧、快速和无依赖...
小白AI：VOC数据集史上最实用的介绍和使用（1）
这是数据集系列文章的第一篇，后续会陆续介绍COCO数据集，OpenImage数据集等。这里的数据集介绍以及使用都是...
数据集介绍
UNC-Ref 训练集：4×10^4 个物体，对应 1.13762×10^5 个自然语言表达验证集：5000 个...
ggpubr添加组间比较参数到图中
这次我们用的的数据集是ToothGrowth数据集，以下是数据集基本介绍 Description The resp...
Python数据分析与机器学习31-SVM案例:人脸识别
一. 数据集介绍数据集我们使用的sklearn官网的数据集代码: 测试记录:['Donald Rumsfeld...
中文垃圾邮件分类（1）
文章主要内容如下：数据集介绍数据预处理特征提取训练分类器实验结果总结 1. 数据集介绍使用中文邮件数据集：tr...

网友评论

本文标题：GLUE多任务数据集介绍

本文链接：https://www.haomeiwen.com/subject/sclqyhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

栏目导航

热点阅读

关于我们|服务条款|联系我们|GLUE多任务数据集介绍|投稿指南|网站地图|RSS订阅|排版工具|手机版

提供经典美文摘抄,优美散文欣赏,现代诗歌精选,短篇小说,心情随笔,表白情书范文,故事会在线阅读欣赏

Copyright © 2014-2023 Haomeiwen.com All Rights Reserved. 好美文阅读网版权所有

备案信息：桂公网安备 45052102000051号 · 桂ICP备13007215号-3

本站所收录作品、热点评论等信息部分来源互联网，目的只是为了系统归纳学习和传递资讯

所有作品版权归原创作者所有，与本站立场无关，如不慎侵犯了你的权益，请联系我们告知，我们将做删除处理！