摘要: ViT vs Swin Transformer ViT 和 Swin Transformer 的区别 1. 架构设计 ViT (Vision Transformer): ViT 直接将图像分割成固定大小的非重叠小块(patches),然后将每个小块展开成一个向量,并将这些向量序列作为输入送入标准的T 阅读全文
posted @ 2024-08-24 22:56 海_纳百川 阅读(1440) 评论(0) 推荐(0)
本站总访问量