CV技术指南（公众号）

2025年6月4日

CVPR 2025 Highlight l 北大团队开源视觉搜索方法 DyFo，无需训练，提升多模态大模型细粒度理解能力

摘要：前言本文给大家带来北京大学彭宇新团队教授的最新工作，一种训练无关的动态聚焦视觉搜索方法，论文已被CVPR 2025接收为 Highlight（前13.5%）并完全开源！欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自我爱计算机视觉仅阅读全文

posted @ 2025-06-04 15:52 CV技术指南（公众号）阅读(342) 评论(0) 推荐(0)

经典ReLU回归！重大缺陷「死亡ReLU问题」已被解决

摘要：前言本文让 ReLU 在保持原始前向行为的同时，避免梯度为零的问题，从而复活死神经元。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享，若侵权请联系删除 CV方向的准研究生们，未来三年如何度过？招聘高光谱图像阅读全文

posted @ 2025-06-04 15:49 CV技术指南（公众号）阅读(98) 评论(0) 推荐(0)

CVPR 2025 | Meta提出FovealSeg：毫秒级IOI分割

摘要：前言最近，一项来自纽约大学和 Meta Reality Labs 的联合研究引发了行业关注：Foveated Instance Segmentation —— 一种结合眼动追踪信息进行实例分割的新方法，已被 CVPR 2025 正式接收。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最阅读全文

posted @ 2025-06-04 15:45 CV技术指南（公众号）阅读(345) 评论(0) 推荐(0)

2025年5月30日

CVPR 2025 Oral | 中科院、中山大学等提出真实世界去雨模型VDMamba，效果好、速度快、兼顾增强下游视觉任务

摘要：前言本篇分享 CVPR 2025 Oral 论文Semi-Supervised State-Space Model with Dynamic Stacking Filter for Real-World Video Deraining，中科院、中山大学等提出真实世界去雨模型VDMamba，效果好、阅读全文

posted @ 2025-05-30 16:26 CV技术指南（公众号）阅读(255) 评论(0) 推荐(0)

CVPR 2025｜AnomalyAny：异常检测新工作，利用Stable Diffusion生成真实多样异常样本！

摘要：前言本文介绍了一种名为AnomalyAny的创新框架，它利用Stable Diffusion的强大生成能力，仅需单个正常样本和文本描述，即可生成逼真且多样化的异常样本，有效解决了视觉异常检测中异常样本稀缺的难题，为工业质检、医疗影像等领域提供了新的解决方案。欢迎关注公众号CV技术指南，专注于计算阅读全文

posted @ 2025-05-30 16:22 CV技术指南（公众号）阅读(320) 评论(0) 推荐(0)

长推理≠高精度！自适应切换“秒答”与“深思”：省Token与提精度的双赢哲学

摘要：前言长 CoT 推理并非总能提升准确率，甚至会削弱模型处理简单任务的能力。为此，本文提出基于置信度的自适应推理框架（CAR），它能根据模型困惑度动态选择短回答或详细的长文本推理：首先生成简短回答并评估困惑度，仅在模型置信度低（困惑度高）时触发推理。欢迎关注公众号CV技术指南，专注于计算机视觉的技阅读全文

posted @ 2025-05-30 16:17 CV技术指南（公众号）阅读(133) 评论(0) 推荐(0)

2025年5月28日

用于图像分割的自监督学习（Self-Supervised Learning）方法综述

摘要：前言本篇分享论文Self-Supervised Learning for Image Segmentation:A Comprehensive Survey，自监督学习在图像分割中的全面综述。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文阅读全文

posted @ 2025-05-28 09:57 CV技术指南（公众号）阅读(310) 评论(0) 推荐(0)

何恺明团队新作MeanFlow：单步图像生成SOTA，性能提升高达50%！

摘要：前言这段时间，大神何恺明真是接连不断地发布新研究。这不，他又放出一篇新作！作者团队来自 CMU 以及 MIT。欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读、CV招聘信息。本文转载自机器之心仅用于学术分享，若侵权请联系删除 CV方向的准研究生们，未来三年如阅读全文

posted @ 2025-05-28 09:51 CV技术指南（公众号）阅读(229) 评论(0) 推荐(0)

ICML 2025 | 自回归OUT！TokenSwift实现无损3倍加速，超长文本也能飞起来

摘要：前言生成超长文本的背后，却隐藏着令人咋舌的计算成本 —— 长时间的等待、巨大的内存负担以及偶尔重复乏味的输出，严重制约了这些模型的真正潜力。面对这一挑战，BIGAI NLCo 团队提出了一项全新的推理加速框架 —— TokenSwift，该工作已成功被 ICML 2025正式接收！欢迎关注公众号阅读全文

posted @ 2025-05-28 09:48 CV技术指南（公众号）阅读(104) 评论(0) 推荐(0)

2025年5月26日

ICML 2025 | 大模型深度思考新范式

摘要：前言本文提出一个交替「推理 - 擦除」的深度思考新范式 PENCIL，比传统 CoT 更高效地解决更复杂的推理任务。理论上，我们证明 PENCIL 可用最优空间与最优时间下解决所有可计算问题，而这对于传统的 CoT 是不可能的！该工作已被机器学习顶会 ICML 2025 收录。欢迎关注公众号CV 阅读全文

posted @ 2025-05-26 14:56 CV技术指南（公众号）阅读(227) 评论(0) 推荐(0)

公告