摘要: 前言 多模态大模型在视觉理解领域取得突破的同时,其推理效率受限于动态解码过程带来的计算与显存压力。传统方法聚焦预填充阶段的视觉token压缩,却在解码阶段因文本序列增长而逐渐失效。为此,研究团队提出Dynamic-LLaVA动态优化框架,首创跨阶段协同加速机制。 欢迎关注公众号CV技术指南,专注于计 阅读全文
posted @ 2025-04-30 11:16 CV技术指南(公众号) 阅读(196) 评论(0) 推荐(0)
摘要: 前言 本文提出了一种用于图像恢复的双域条带注意力机制(Dual-domain strip attention mechanism),通过增强表示学习来提升图像恢复任务的性能。该机制由空间条带注意力单元和频率条带注意力单元组成,能够有效处理不同尺寸的退化问题,并在12个不同数据集上实现了四种图像恢复任 阅读全文
posted @ 2025-04-30 11:04 CV技术指南(公众号) 阅读(512) 评论(0) 推荐(0)