会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
258-333
博客园
首页
新随笔
联系
订阅
管理
2025年3月9日
2025.3.9
摘要: 一、多模态编码与特征提取 模态编码器 每个模态通过独立的预训练编码器(如视觉编码器、文本编码器)进行特征提取。例如: 视觉编码器:通常采用ViT(Vision Transformer)、CLIP-ViT或EVA-CLIP等模型,将图像分割为块(Patch)并通过Transformer编码为向量 1
阅读全文
posted @ 2025-03-09 23:54 258333
阅读(96)
评论(0)
推荐(0)
公告