摘要:
论文提出了一种新的ViT位置编码CPE,基于每个token的局部邻域信息动态地生成对应位置编码。CPE由卷积实现,使得模型融合CNN和Transfomer的优点,不仅可以处理较长的输入序列,也可以在视觉任务中保持理想的平移不变性。从实验结果来看,基于CPE的CPVT比以前的位置编码方法效果更好 来源 阅读全文
posted @ 2024-04-16 13:23
晓飞的算法工程笔记
阅读(1558)
评论(0)
推荐(0)
摘要:
论文基于改进训练配置以及一种新颖的蒸馏方式,提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时,DeiT以卷积网络作为teacher,能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看,效果很不错 来源:晓飞的算法工程笔记 公众号 论文: Tr 阅读全文
posted @ 2024-04-16 13:11
晓飞的算法工程笔记
阅读(648)
评论(0)
推荐(0)

浙公网安备 33010602011771号