摘要: 红外小目标检测(Infrared Small Target Detection, IRSTD)是预警、侦察和精确制导等国防安全领域的关键技术。该任务的核心挑战在于,目标通常只占几个像素,缺乏明显的形状和纹理,且极易被复杂背景中的高亮杂波(如云层边缘、地面噪声)所淹没。 为了解决这一难题,该论文提出了一种对**尺度(Scale)和位置(Location)** 信息高度敏感的新型检测网络。其核心思想是,通过精心设计的网络结构,使模型不仅能捕捉到微弱目标的多尺度特征,还能在解码和上采样过程中最大限度地保留其精确的空间位置信息。这种双重敏感性设计,旨在从根本上提升模型在低信噪比和复杂背景下检测微小目标的能力,显著降低漏检率和虚警率。 阅读全文
posted @ 2025-11-26 18:19 Lab4AI大模型实验室 阅读(19) 评论(0) 推荐(0)
摘要: NeurlPS 2025!普林斯顿团队成果:InFlux首破动态相机内参逐帧真值难题,重塑3D视觉评估 论文标题:InFlux: A Benchmark for Self-Calibration of Dynamic Intrinsics of Video Cameras 作者团队:普林斯顿大学 发 阅读全文
posted @ 2025-11-26 16:45 Lab4AI大模型实验室 阅读(5) 评论(0) 推荐(0)
摘要: 从 50 步到 4 步:LightX2V 如何把视频生成拉进20 秒时代? 还在为高质量视频生成「又慢又重」头疼吗? 传统扩散式视频生成模型往往需要20~50步迭代过程,即便生成几十帧的短视频,也需长时间占用GPU资源,日志持续输出却进度缓慢。 而LightX2V的核心目标,是从技术底层重构这一流程 阅读全文
posted @ 2025-11-26 16:15 Lab4AI大模型实验室 阅读(13) 评论(0) 推荐(0)
摘要: ECCV 2024!面向领域泛化分割的文本查询驱动掩码Transformer| 语义分割 | 计算机视觉 01 论文概述 论文名称:Textual query-driven mask transformer for domain generalized segmentation —— 面向领域泛化分 阅读全文
posted @ 2025-11-25 17:24 Lab4AI大模型实验室 阅读(5) 评论(0) 推荐(0)
摘要: DreamFuse: Adaptive Image Fusion with Diffusion Transformer —— 基于扩散变换器的自适应图像融合框架 阅读全文
posted @ 2025-11-25 15:55 Lab4AI大模型实验室 阅读(26) 评论(0) 推荐(0)
摘要: 从帧到世界:面向世界模型的长视频生成 世界模型是一种能够“看懂”现实世界规则并“预测”其动态变化的生成式AI,例如理解“抛球会落地”或“太阳东升西落”等常识。其技术本质是通过大量数据学习物理规律、因果关系和时空逻辑,形成兼具“认知”与“预测”能力的模型框架。 视频生成不只是拼接现有素材,而是由AI从 阅读全文
posted @ 2025-11-25 10:48 Lab4AI大模型实验室 阅读(18) 评论(0) 推荐(0)
摘要: 写论文的正确姿势:用代码排版?没听错,就是 LaTeX!| 附保姆级安装教程 你是不是也被Word的格式崩溃折磨过? 论文一改模板,公式全乱,页码飘移——如果你有过这样的经历,那么你该认识一下LaTeX。 「LaTeX」,能轻松搞定专业公式和图表排版,堪称科研党的效率神器! 今天就用最通俗的话,教你 阅读全文
posted @ 2025-11-20 18:12 Lab4AI大模型实验室 阅读(442) 评论(0) 推荐(0)
摘要: 这所双非高校在AAAI 2026上发表11篇论文 近日,人工智能领域国际顶尖学术会议AAAI 2026(第40届人工智能大会)论文录用结果公布。武汉科技大学计算机科学与技术学院5位老师的高质量论文被录用,录用数量超历年总和,体现了学院在人工智能前沿研究方面的持续发展与科研实力的显著提升。 被录用的论 阅读全文
posted @ 2025-11-20 11:47 Lab4AI大模型实验室 阅读(26) 评论(0) 推荐(0)
摘要: CVPR 2024 | 赋能大语言模型以精准理解视频时序瞬间 | LLM | 时序预测 01 论文概述 论文名称:VTimeLLM: Empower LLM to Grasp Video Moments —— 赋能大语言模型以精准理解视频时序瞬间 👉一键直达论文 👉Lab4AI大模型实验室论文 阅读全文
posted @ 2025-11-19 16:15 Lab4AI大模型实验室 阅读(10) 评论(0) 推荐(0)
摘要: CVPR 2022!经典论文!稳定扩散模型(Stable Diffusion)背后的革命性技术:隐空间扩散模型 01 论文概述 论文名称:High-Resolution Image Synthesis with Latent Diffusion Models —— 稳定扩散模型(Stable Dif 阅读全文
posted @ 2025-11-19 15:11 Lab4AI大模型实验室 阅读(97) 评论(0) 推荐(0)