2025 年 11月 25 日随笔档案 - Lab4AI大模型实验室

2025年11月25日

ECCV 2024！面向领域泛化分割的文本查询驱动掩码Transformer| 语义分割 | 计算机视觉

摘要： ECCV 2024！面向领域泛化分割的文本查询驱动掩码Transformer| 语义分割 | 计算机视觉 01 论文概述论文名称：Textual query-driven mask transformer for domain generalized segmentation —— 面向领域泛化分阅读全文

posted @ 2025-11-25 17:24 Lab4AI大模型实验室阅读(11) 评论(0) 推荐(0)

# CVPR 2025| 基于扩散变换器的自适应图像融合框架| 计算机视觉 | 图像编辑

摘要： DreamFuse: Adaptive Image Fusion with Diffusion Transformer —— 基于扩散变换器的自适应图像融合框架阅读全文

posted @ 2025-11-25 15:55 Lab4AI大模型实验室阅读(46) 评论(0) 推荐(0)

从帧到世界：面向世界模型的长视频生成

摘要：从帧到世界：面向世界模型的长视频生成世界模型是一种能够“看懂”现实世界规则并“预测”其动态变化的生成式AI，例如理解“抛球会落地”或“太阳东升西落”等常识。其技术本质是通过大量数据学习物理规律、因果关系和时空逻辑，形成兼具“认知”与“预测”能力的模型框架。视频生成不只是拼接现有素材，而是由AI从阅读全文

posted @ 2025-11-25 10:48 Lab4AI大模型实验室阅读(46) 评论(0) 推荐(0)

lab4ai

公告