上一页 1 2 3 4 5 6 7 8 9 10 ··· 20 下一页
摘要: 论文提出了T2T-ViT模型,引入tokens-to-token(T2T)模块有效地融合图像的结构信息,同时借鉴CNN结果设计了deep-narrow的ViT主干网络,增强特征的丰富性。在ImageNet上从零训练时,T2T-ViT取得了优于ResNets的性能MobileNets性能相当 来源:晓 阅读全文
posted @ 2024-05-20 12:30 晓飞的算法工程笔记 阅读(148) 评论(0) 推荐(0) 编辑
摘要: 最近,有一些大型内核卷积网络的研究,但考虑到卷积的平方复杂度,扩大内核会带来大量的参数,继而引发严重的优化问题。受人类视觉的启发,论文提出了外围卷积,通过参数共享将卷积的复杂性从 \(O(K^{2})\) 降低到 \(O(\mathrm{log} K)\),有效减少 90% 以上的参数数量并设法将内 阅读全文
posted @ 2024-04-24 13:30 晓飞的算法工程笔记 阅读(287) 评论(0) 推荐(0) 编辑
摘要: 论文设计了新的CNN-ViT混合神经网络FasterViT,重点关注计算机视觉应用的图像吞吐能力。FasterViT结合CNN的局部特征学习的特性和ViT的全局建模特性,引入分层注意力(HAT)方法在降低计算成本的同时增加窗口间的交互。在包括分类、对象检测和分割各种CV任务上,FasterViT在精 阅读全文
posted @ 2024-04-23 13:28 晓飞的算法工程笔记 阅读(419) 评论(0) 推荐(1) 编辑
摘要: 深度学习模型通常堆叠大量结构和功能相同的结构,虽然有效,但会导致参数数量大幅增加,给实际应用带来了挑战。为了缓解这个问题,LORS(低秩残差结构)允许堆叠模块共享大部分参数,每个模块仅需要少量的唯一参数即可匹配甚至超过全量参数的性能。实验结果表明,LORS减少解码器 70% 的参数后仍可达到与原始模 阅读全文
posted @ 2024-04-22 13:19 晓飞的算法工程笔记 阅读(269) 评论(0) 推荐(2) 编辑
摘要: 论文重新审视了深度神经网络中的不确定性估计技术,并整合了一套技术以增强其可靠性。论文的研究表明,多种技术(包括模型正则化、分类器改造和优化策略)的综合应用显着提高了图像分类任务中不确定性预测的准确性 来源:晓飞的算法工程笔记 公众号 论文: SURE: SUrvey REcipes for buil 阅读全文
posted @ 2024-04-19 12:07 晓飞的算法工程笔记 阅读(163) 评论(0) 推荐(0) 编辑
摘要: 论文提出了一种新的ViT位置编码CPE,基于每个token的局部邻域信息动态地生成对应位置编码。CPE由卷积实现,使得模型融合CNN和Transfomer的优点,不仅可以处理较长的输入序列,也可以在视觉任务中保持理想的平移不变性。从实验结果来看,基于CPE的CPVT比以前的位置编码方法效果更好 来源 阅读全文
posted @ 2024-04-16 13:23 晓飞的算法工程笔记 阅读(519) 评论(0) 推荐(0) 编辑
摘要: 论文基于改进训练配置以及一种新颖的蒸馏方式,提出了仅用ImageNet就能训练出来的Transformer网络DeiT。在蒸馏学习时,DeiT以卷积网络作为teacher,能够结合当前主流的数据增强和训练策略来进一步提高性能。从实验结果来看,效果很不错 来源:晓飞的算法工程笔记 公众号 论文: Tr 阅读全文
posted @ 2024-04-16 13:11 晓飞的算法工程笔记 阅读(140) 评论(0) 推荐(0) 编辑
摘要: 论文直接将纯Trasnformer应用于图像识别,是Trasnformer在图像领域正式挑战CNN的开山之作。这种简单的可扩展结构在与大型数据集的预训练相结合时,效果出奇的好。在许多图像分类数据集上都符合或超过了SOTA,同时预训练的成本也相对较低 来源:晓飞的算法工程笔记 公众号 论文: An I 阅读全文
posted @ 2024-04-12 13:19 晓飞的算法工程笔记 阅读(442) 评论(0) 推荐(2) 编辑
摘要: 论文认为预测结果能够更准确地区分正负样本,提出结合预测结果IoU和anchor IoU来准确地选择最高质量的预测结果进行网络训练。整体算法简单但十分有效,值得看看 来源:晓飞的算法工程笔记 公众号 论文: Dynamic Label Assignment for Object Detection b 阅读全文
posted @ 2024-04-10 13:31 晓飞的算法工程笔记 阅读(74) 评论(0) 推荐(0) 编辑
摘要: 论文提出能够适配硬件加速的动态网络DS-Net,通过提出的double-headed动态门控来实现动态路由。基于论文提出的高性能网络设计和IEB、SGS训练策略,仅用1/2-1/4的计算量就能达到静态SOTA网络性能,实际加速也有1.62倍 来源:晓飞的算法工程笔记 公众号 论文: Dynamic 阅读全文
posted @ 2024-04-09 13:22 晓飞的算法工程笔记 阅读(232) 评论(0) 推荐(2) 编辑
上一页 1 2 3 4 5 6 7 8 9 10 ··· 20 下一页