软件构造大作业——基于提示词约束的故事插图生成策略优化

软件构造大作业——基于提示词约束的故事插图生成策略优化

一、问题背景

在插图生成模块初期实现中,虽然系统能够成功生成图片,但生成结果的风格差异较大,部分图片偏写实、偏抽象,整体视觉效果不统一,与儿童绘本风格存在明显偏差。

该问题的根本原因在于文生图模型生成过程缺乏足够的风格约束。


二、设计目标

本模块的目标是:

  1. 固定插图的整体画风
  2. 降低模型生成结果的随机性
  3. 提高插图与故事内容的匹配度

三、提示词结构设计

系统采用“固定提示词前缀 + 故事摘要”的方式构造文生图提示词。

固定提示词用于控制风格,动态部分用于描述故事内容。


四、提示词构造完整实现

def build_image_prompt(story: dict) -> str:
    base_prompt = (
        "儿童绘本插画风格,卡通风格,线条柔和,"
        "色彩明亮,温馨,适合儿童阅读,高清插画"
    )

    content_hint = story["title"]
    return f"{base_prompt},主题:{content_hint}"

通过固定前缀,保证每次生成插图处于统一画风范围内。


五、多轮测试与优化

在测试过程中,逐步加入以下限制:

STYLE_LIMITS = [
    "避免写实风格",
    "避免黑暗或恐怖元素",
    "避免复杂背景",
    "避免过多角色"
]

最终将这些限制合并进固定提示词,使模型输出更加稳定。


六、优化效果对比

引入提示词约束后,插图在以下方面明显改善:

  • 风格一致性显著提升
  • 色彩和构图更适合儿童阅读
  • 前端整体展示更加协调

七、小结

通过对文生图提示词进行工程化设计,而非简单文本拼接,本模块实现了对插图生成质量的有效控制,证明提示词在 AI 应用中的重要性。



posted @ 2025-12-14 17:04  元始天尊123  阅读(3)  评论(0)    收藏  举报