摘要: 论文直接将纯Trasnformer应用于图像识别,是Trasnformer在图像领域正式挑战CNN的开山之作。这种简单的可扩展结构在与大型数据集的预训练相结合时,效果出奇的好。在许多图像分类数据集上都符合或超过了SOTA,同时预训练的成本也相对较低 来源:晓飞的算法工程笔记 公众号 论文: An I 阅读全文
posted @ 2024-04-12 13:20 晓飞的算法工程笔记 阅读(284) 评论(0) 推荐(2) 编辑