首页 > 移动开发 > 详细

论文阅读（11）RoBERTa: A Robustly Optimized BERT Pretraining Approach（2019）

时间：2020-10-19 22:16:31 阅读：49 评论：0 收藏：0 [点我收藏+]

标签：性能训练预处理 choices 超过 parameter 论文处理 param

RoBERTa: A Robustly Optimized BERT Pretraining Approach（一种鲁棒优化的 BERT预训练方法）

细读，半天

Motivation

hypeparameter choices 对我们最终结果影响很大。
提出一项 BERT预处理的replication study：
- 仔细测量了许多 key hyperparameters 和 training data size 的影响
- 发现BERT的训练明显不足，可以匹配或超过其后发布的每个模型的性能。
- RoBERTa在 GLUE，RACE，SQuAD上获得好的效果。

论文阅读（11）RoBERTa: A Robustly Optimized BERT Pretraining Approach（2019）

标签：性能训练预处理 choices 超过 parameter 论文处理 param

原文地址：https://www.cnblogs.com/douzujun/p/13837707.html

踩

(0)

赞

(0)

举报

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行

更多

友情链接

兰亭集智国之画百度统计站长统计阿里云 chrome插件新版天听网

关于我们 - 联系我们 - 留言反馈

© 2014 mamicode.com 版权所有联系我们:gaon5@hotmail.com

迷上了代码！