2025 年 7月 11 日随笔档案 - deephub

2025年7月11日

摘要：视觉Transformer在计算机视觉领域展现出强大的性能，但其对输入图像尺寸的严格约束限制了在实际应用中的灵活性。ViTAR（Vision Transformer with Any Resolution）通过引入模糊位置编码技术，实现了对任意分辨率图像的处理能力，为计算机视觉的实际应用开辟了新的技阅读全文

posted @ 2025-07-11 13:41 deephub 阅读(17) 评论(0) 推荐(0)

deephub

overfit深度学习

公告