摘要: FILM(Image Fusion via Vision-Language Model)方法实现步骤分析 本文提出的 FILM 方法通过结合视觉-语言模型(VLM)的语义理解能力,将文本信息引入图像融合任务,以增强对深层语义特征的利用。以下是其具体实现步骤: 1. 文本特征融合(Text Featu 阅读全文
posted @ 2025-03-21 14:43 lazyGuai 阅读(65) 评论(0) 推荐(0)