告别修图翻车!阿里Qwen团队 & 港科大提出Qwen-Image-Layered ,面向内在可编辑性的图层分解

告别修图翻车!阿里Qwen团队 & 港科大提出Qwen-Image-Layered ,面向内在可编辑性的图层分解

论文标题:Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition

作者团队:香港科技大学阿里巴巴

发布时间:2025年12月17日

论文链接

大模型实验室Lab4AI论文阅读

Lab4AI平台提供AI导读和AI翻译等工具,辅助论文阅读。

✨背景

当前视觉生成模型在图像编辑时面临一致性挑战:传统光栅图像是平面且内容纠缠的,编辑操作易引发语义漂移、几何错位等问题;专业设计工具依赖分层表示实现编辑一致性,但现有方法在复杂场景下难以将图像分解为高质量、语义解耦的层,导致编辑精度与灵活性不足。

✨研究内容

论文推出 Qwen-Image-Layered,这是一款能够将图像分解为多个 RGBA 图层的模型。这种分层表示赋予了图像内在的可编辑性:每个图层都可以独立操作,而不会影响其他内容。

同时,这种分层结构天然支持高保真的基本编辑操作,例如缩放、移动和重新着色。

通过将不同元素物理地隔离到不同的图层中,我们的方法实现了高保真的编辑效果。

posted @ 2025-12-29 16:08  Lab4AI大模型实验室  阅读(1)  评论(0)    收藏  举报