摘要: 论文地址:https://arxiv.org/pdf/1906.08237.pdf 简介 XLNet是一个类似BERT的模型,但是它采用了通用的自回归预训练方法(AR模型),而基于DAE的Bert模型采用的则是降噪自动编码方法(AE模型),bert和AR模型的区别主要是在以下三方面: 1、独立假设: 阅读全文
posted @ 2020-03-06 17:10 justDoIT& 阅读(945) 评论(0) 推荐(0)