TiNO-Edit：基于扩散的稳健图像编辑的时间步长和噪声优化

尽管有许多尝试利用预训练的文本到图像模型（T2I）（如稳定扩散（SD）），进行可控图像编辑，但产生良好的可预测结果仍然是一个挑战。以前的方法要么侧重于在特定数据集上，对预训练的T2I模型进行精细调优，以生成特定类型的图像（例如，使用特定的对象或人），要么侧重于优化每个输入图像的权重、文本提示和/或学习特征，以试图引导图像生成器产生所需的结果。然而，这些方法都有缺点，无法以可预测和可控的方式产生良好的结果。为了解决这个问题，提出了TiNO Edit，这是一种基于SD的方法，专注于在编辑过程中优化噪声模式和扩散时间步长，这是以前未探索过的。通过这个简单的更改，能够生成与原始图像更好地对齐，并重新实现所需结果的结果。此外，提出了一组新的损失函数，它们在SD的潜在域中运行，与在像素域中运行的先前损失相比，大大加快了优化速度。改进的方法可以很容易地应用于SD的变体，包括文本反转和DreamBooth，它们对新概念进行编码并将其合并到编辑结果中。展示了通过改进的方法实现的一系列图像编辑功能。

TiNO Edit启用的功能概述，如图4-37所示。

图4-37 TiNO Edit启用的功能概述

TiNO Edit提供各种图像编辑功能，可以与DreamBooth（DB）或文本反转（TI）一起运行。通过利用扩散时间步长和噪声优化技术，可以生成逼真和高质量的输出。

posted @ 2024-12-18 04:18 吴建明wujianming 阅读(25) 评论(0) 收藏举报

刷新页面返回顶部

吴建明

微信视频号：sph0RgSyDYV47z6 快手号：4874645212 抖音号：dy0so323fq2w 小红书号：95619019828 B站1：UID:3546863642871878 B站2：UID: 3546955410049087

TiNO-Edit：基于扩散的稳健图像编辑的时间步长和噪声优化

公告