摘要: 前面已经介绍了简单的视觉编码器,这里主要介绍多模态中使用比较多的两种backbone:1、Clip;2、SAM。对于这两个backbone简单介绍基本原理,主要是讨论使用这个backbone。 1、CV中常用Backbone-2:ConvNeXt模型详解 2、CV中常用Backbone(Resnet 阅读全文
posted @ 2025-05-25 21:24 Big-Yellow-J 阅读(344) 评论(0) 推荐(0)
levels of contents