摘要: 论文提出了一种新的ViT位置编码CPE,基于每个token的局部邻域信息动态地生成对应位置编码。CPE由卷积实现,使得模型融合CNN和Transfomer的优点,不仅可以处理较长的输入序列,也可以在视觉任务中保持理想的平移不变性。从实验结果来看,基于CPE的CPVT比以前的位置编码方法效果更好 来源 阅读全文
posted @ 2024-04-16 13:23 晓飞的算法工程笔记 阅读(1558) 评论(0) 推荐(0)
摘要: 论文基于改进训练配置以及一种新颖的蒸馏方式,提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时,DeiT以卷积网络作为teacher,能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看,效果很不错 来源:晓飞的算法工程笔记 公众号 论文: Tr 阅读全文
posted @ 2024-04-16 13:11 晓飞的算法工程笔记 阅读(648) 评论(0) 推荐(0)