摘要: 论文设计了新的CNN-ViT混合神经网络FasterViT,重点关注计算机视觉应用的图像吞吐能力。FasterViT结合CNN的局部特征学习的特性和ViT的全局建模特性,引入分层注意力(HAT)方法在降低计算成本的同时增加窗口间的交互。在包括分类、对象检测和分割各种CV任务上,FasterViT在精 阅读全文
posted @ 2024-04-23 13:28 晓飞的算法工程笔记 阅读(419) 评论(0) 推荐(1) 编辑