摘要:基于 Dropout 的这种特殊方式对网络带来的随机性,研究员们提出了 R-Drop 来进一步对(子模型)网络的输出预测进行了正则约束。 本文分享自华为云社区《R-Drop论文复现与理论讲解》,作者: 李长安。 R-Drop: Regularized Dropout for Neural Ne