摘要: https://mp.weixin.qq.com/s/k9g_KmWuNsbM-iKYco7gwA 本文主要介绍了Attention Free Transformer(AFT),同时作者还引入了AFT-local和AFT-Conv,这两个模型在保持全局连通性的同时,利用了局域性和空间权重共享的思想。 阅读全文
posted @ 2021-07-12 07:45 水木清扬 阅读(291) 评论(0) 推荐(0)