2025 年 2月 20 日随笔档案 - TfiyuenLau - 博客园

2025年2月20日

ViT, Transformer架构出圈到cv

摘要：

ViT, Transformer架构出圈到cv

Vision Transformer（ViT）通过采用自注意力机制处理图像块，革新了图像识别方法，展现了在大规模数据集上超越传统卷积神经网络的潜力。阅读全文

posted @ 2025-02-20 21:56 TfiyuenLau 阅读(735) 评论(0) 推荐(0)