摘要: ECCV 2024!面向领域泛化分割的文本查询驱动掩码Transformer| 语义分割 | 计算机视觉 01 论文概述 论文名称:Textual query-driven mask transformer for domain generalized segmentation —— 面向领域泛化分 阅读全文
posted @ 2025-11-25 17:24 Lab4AI大模型实验室 阅读(5) 评论(0) 推荐(0)
摘要: DreamFuse: Adaptive Image Fusion with Diffusion Transformer —— 基于扩散变换器的自适应图像融合框架 阅读全文
posted @ 2025-11-25 15:55 Lab4AI大模型实验室 阅读(26) 评论(0) 推荐(0)
摘要: 从帧到世界:面向世界模型的长视频生成 世界模型是一种能够“看懂”现实世界规则并“预测”其动态变化的生成式AI,例如理解“抛球会落地”或“太阳东升西落”等常识。其技术本质是通过大量数据学习物理规律、因果关系和时空逻辑,形成兼具“认知”与“预测”能力的模型框架。 视频生成不只是拼接现有素材,而是由AI从 阅读全文
posted @ 2025-11-25 10:48 Lab4AI大模型实验室 阅读(18) 评论(0) 推荐(0)