摘要: ViT, Transformer架构出圈到cv Vision Transformer(ViT)通过采用自注意力机制处理图像块,革新了图像识别方法,展现了在大规模数据集上超越传统卷积神经网络的潜力。 阅读全文
posted @ 2025-02-20 21:56 TfiyuenLau 阅读(657) 评论(0) 推荐(0)