告别修图翻车！阿里Qwen团队 & 港科大提出Qwen-Image-Layered ，面向内在可编辑性的图层分解

论文标题：Qwen-Image-Layered: Towards Inherent Editability via Layer Decomposition

发布时间：2025年12月17日

Lab4AI平台提供AI导读和AI翻译等工具，辅助论文阅读。

✨背景

当前视觉生成模型在图像编辑时面临一致性挑战：传统光栅图像是平面且内容纠缠的，编辑操作易引发语义漂移、几何错位等问题；专业设计工具依赖分层表示实现编辑一致性，但现有方法在复杂场景下难以将图像分解为高质量、语义解耦的层，导致编辑精度与灵活性不足。

论文推出 Qwen-Image-Layered，这是一款能够将图像分解为多个 RGBA 图层的模型。这种分层表示赋予了图像内在的可编辑性：每个图层都可以独立操作，而不会影响其他内容。

同时，这种分层结构天然支持高保真的基本编辑操作，例如缩放、移动和重新着色。

通过将不同元素物理地隔离到不同的图层中，我们的方法实现了高保真的编辑效果。

posted @ 2025-12-29 16:08 Lab4AI大模型实验室阅读(53) 评论(0) 收藏举报

刷新页面返回顶部