首页 > 其他好文 > 详细

NLP的比赛和数据集

时间：2020-01-31 10:38:44 阅读：771 评论：0 收藏：0 [点我收藏+]

标签：schema body ksh 中文版 task 识别 infer 推理 dmi

整理了NLP领域的比赛、数据集、模型

比赛	网站	主办方(作者)
decaNLP	http://decanlp.com/	Salesforce
CLUE	https://github.com/CLUEbenchmark/CLUE	中文任务基准
GLUE	https://gluebenchmark.com/tasks
BioBERT	https://github.com/dmis-lab/biobert	生物医学领域的NLP任务
ERNIE	https://github.com/PaddlePaddle/ERNIE	百度飞桨
ALBERT

decaNLP

自然语言十项全能多任务挑战

Natural Language Decathlon (decaNLP) 是一个新的基准，要求单独的系统能够完成10项独立的自然语言任务。

问答 Stanford Question Answering Dataset (SQuAD 1.1)
机器翻译 International Workshop on Spoken Language Translation (IWSLT),
自动摘要 CNN/DailyMail (CNN/DM) corpus.
自然语言推理 Multi-Genre Natural Language Inference Corpus (MNLI).
情感分析 Stanford Sentiment Treebank (SST),
语义标签标注 QA-SRL 1.0.
关系抽取 QA-ZRE,
面向全域的对话 Wizard of Oz (WOZ)
语义解析 WikiSQL 【Seq2SQL，https://github.com/salesforce/WikiSQL】
常识推理 Modified Winograd Schema Challenge, MWSC)

评测-GLUE

CoLA、 SST-2、 MRPC、 STS-B、 QQP、 MNLI-m、 QNLI、 RTE
技术图片

评测-CLUE

中文任务基准评测CLUE
AFQMC:蚂蚁语义相似度(Acc)；
TNEWS:文本分类(Acc)；
IFLYTEK:长文本分类(Acc);
CMNLI: 自然语言推理中文版;
COPA: 因果推断;
WSC: Winograd模式挑战中文版;
CSL: 中国科学文献数据集;

模型-BioBERT

https://github.com/dmis-lab/biobert

NER
命名实体识别
RE
关系抽取
QA
问答

模型-ERNIE

https://github.com/PaddlePaddle/ERNIE/blob/develop/README.zh.md

自然语言推断 XNLI
阅读理解 DuReader、CMRC2018、DRCD
命名实体识别 MSRA-NER(SIGHAN2006)
情感分析 ChnSentiCorp
问答任务 NLPCC2016-DBQA
语义相似度 LCQMC、BQ Corpus

模型-ALBERT

模型-TinyBERT

NLP的比赛和数据集

标签：schema body ksh 中文版 task 识别 infer 推理 dmi

原文地址：https://www.cnblogs.com/xuehuiping/p/12200998.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！