2025 年 4月 30 日随笔档案 - CV技术指南（公众号）

2025年4月30日

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

摘要：前言多模态大模型在视觉理解领域取得突破的同时，其推理效率受限于动态解码过程带来的计算与显存压力。传统方法聚焦预填充阶段的视觉token压缩，却在解码阶段因文本序列增长而逐渐失效。为此，研究团队提出Dynamic-LLaVA动态优化框架，首创跨阶段协同加速机制。欢迎关注公众号CV技术指南，专注于计阅读全文

posted @ 2025-04-30 11:16 CV技术指南（公众号）阅读(196) 评论(0) 推荐(0)

【2025年即插即用】全网首发，空间条纹注意力SSA，大感受野特征捕获！

摘要：前言本文提出了一种用于图像恢复的双域条带注意力机制（Dual-domain strip attention mechanism），通过增强表示学习来提升图像恢复任务的性能。该机制由空间条带注意力单元和频率条带注意力单元组成，能够有效处理不同尺寸的退化问题，并在12个不同数据集上实现了四种图像恢复任阅读全文

posted @ 2025-04-30 11:04 CV技术指南（公众号）阅读(512) 评论(0) 推荐(0)

公告