AI图像生成修订的挑战与局限
沮丧的尝试
最近有一则匿名社交媒体帖子广为流传:一位工作室艺术总监试图雇佣AI提示词工程师创作艺术作品,却发现他们完全无法执行细微的修订请求。当要求从画面中移除人物或修复透视错误时,这些提示词工程师要么返回完全不同的艺术作品,要么做出其他不符合要求的奇怪修改。我完全相信尝试修订AI生成艺术确实如此令人沮丧。
例如,我最近向某个智能对话系统提出请求:
“请生成一张霸王龙在盒子里的图片。盒子应该是关闭的,完全看不到霸王龙。”
得到了这个完全合理的回应:
“听起来您想要一张暗示霸王龙存在但实际上不显示它的图片,因为它完全被封闭在盒子里。既然霸王龙不可见,您希望强调盒子的哪些细节或主题来暗示恐龙的存在?”
我确认:
“看不到霸王龙,只需要一些透气孔供它舒适呼吸。”
该系统(使用图像生成模型)给了我这样的结果:
很明显效果不理想——这是个奇怪的盒子,侧面的符号尤其令人困惑。那些是鱿鱼吗?栖息的捕蝇鸟?擀面杖?
该系统有一个功能,可以擦除图像的某些部分并提交更多文本描述这些部分应该如何改变。于是,我遮挡了符号线条并要求:
“用霸王龙的轮廓和‘危险’这个词替换这些符号。”
系统产生了这样的结果:
这勉强算是我要求的,但看起来不太像霸王龙。我再次擦除盒子的那部分并要求更多修订:
“霸王龙应该面向‘危险’这个词。它的轮廓需要有霸王龙那种强大、沉重的外观,特别是头部和颈部。”
系统给了我:
恐龙背对着文字,仍然没有面向“危险”这个词,而且霸王龙的轮廓仍然不太好。我再次要求修订。
“保持厚重的黑色字体,但恢复红色警告文本颜色。霸王龙仍需面向文字而不是背对它,它的下颌太厚重了。”
系统回应:
这...不行。这不算面向文字,下颌仍然不对,文字还像是“危险”吗?更像是“更时髦”?
“霸王龙需要在文字旁边,而不是在文字上方。它肩膀上那个额外的尖峰是怎么回事?它的下颌仍然太厚重了。”
系统回应:
我的回应:
“...这个很完美。现在你能保持一切——纹理、光照、材质——不变,但让盒子看起来大得多吗?现在它看起来只有膝盖高。它需要大到能装下一只霸王龙。”
系统的修订:
似乎我要求的修订越多,结果就越糟糕。如果我允许它修订整个图像,整个过程就会重新开始。
以下是类似的修订过程,这次试图通过修订获得更漂亮的馅饼。
我:“请生成一张长颈鹿参加英国烘焙大赛的图片。”
修订1:我擦除了柜台,要求长颈鹿制作一个有复杂网格花纹的樱桃派。
下面是第5次修订,此时很明显,我越要求复杂的网格花纹,它就变得越粗糙;我越要求深盘派,派就越薄;我越要求单个派,得到的派就越多。当我不将更改限制在图像的特定部分时,我得到了更好的结果,但也经历了巨大的重置。对于下面的图像,我要求该系统保持每个细节完全相同,但要让我们能看到帐篷外正在下雨。不仅图像完全改变了,而且甚至没有下雨。
我的提示:“完美。请保持图像完全不变,除了让我们能看到帐篷外正下着大雨。”
在这张图片中,我要求一条蛇在画一只熊,然后擦除了画作并要求熊四肢站立。修订结果更糟。
图片描述:左边,一条彩虹色的蛇 coiled在画架前。(蛇的线圈分成两半,所以我猜它是分叉尾蛇)。画架上是一幅坐着的熊的画,相当逼真。右边,熊被一个更小、更差的蛇复制品取代。没有熊。
这是另一个例子,我要求一只鹿在杂货店里,然后要求鹿变成小鹿。到第5次修订(试图给小鹿斑点,试图修复使它看起来像漂浮的阴影),鹿的质量和杂货店背景都恶化了。
图片描述:左边原始图像中,鹿看起来有点像塑料模特,但在光照和阴影方面与杂货店场景的其他部分相符。右边修订后的图像中,鹿现在是一只小鹿,具有奇怪的平坦阴影,叠加在场景上而不是站在其中。它的眼睛奇怪地湿润且立体,但小鹿的其余部分直接盯着相机,没有明显的深度。在杂货店过道背景被修订的地方,货架失去了所有细节和与杂货店的相似性,天花板灯具现在延伸到地板上。
这是一个一次性示例,我要求该系统生成一幅受损的那稣壁画,然后将壁画修复到完好如新。
图片描述:左边的图像似乎是一幅受损的耶稣壁画(具有明显的长手指,连接到双手)。中间的图像相同,除了耶稣的脸和光环不再显得受损。然而,耶稣的脸现在奇怪地光滑闪亮,不再与绘画的其余部分协调,他的眼睛是奇怪的蓝色和黑色螺旋。右边的图像中,耶稣的脸完全不同的风格,几乎是喷枪风格,他的眼睛完全不匹配了。
因此,每次要求AI修订图像时,它要么重新开始,要么让它变得越来越灾难。与AI生成图像打交道的人必须调整他们的创作愿景以适应系统的输出——或者带着一种心态,即任何符合要求的东西都足够好。
还有一个事实是,图像生成模型直接与那些作品被未经许可或补偿用于训练这些模型的艺术家竞争。而且训练和运行这些模型具有巨大的环境足迹。AI生成图像已经成为广告、搜索结果或研究论文是骗局的标志。
我并不惊讶有些地方寻找廉价的填充图片,不介意AI生成图像的问题。但对于其他所有人,我认为很快就能清楚,你需要真正的艺术家,而不是仿制品。
额外内容:独角兽变得滑稽地糟糕
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)
公众号二维码

公众号二维码


浙公网安备 33010602011771号