摘要: 论文:https://arxiv.org/pdf/1901.02860.pdf 源码:https://github.com/kimiyoung/transformer-xl 简介:Transformer-XL(extra long)是为了进一步提升Transformer建模长期依赖的能力。它的核心算 阅读全文
posted @ 2021-03-26 18:25 AliceYing 阅读(446) 评论(0) 推荐(0)