软件构造大作业——基于提示词约束的故事插图生成策略优化

一、问题背景

在插图生成模块初期实现中，虽然系统能够成功生成图片，但生成结果的风格差异较大，部分图片偏写实、偏抽象，整体视觉效果不统一，与儿童绘本风格存在明显偏差。

该问题的根本原因在于文生图模型生成过程缺乏足够的风格约束。

二、设计目标

本模块的目标是：

固定插图的整体画风
降低模型生成结果的随机性
提高插图与故事内容的匹配度

三、提示词结构设计

系统采用“固定提示词前缀 + 故事摘要”的方式构造文生图提示词。

固定提示词用于控制风格，动态部分用于描述故事内容。

四、提示词构造完整实现

def build_image_prompt(story: dict) -> str:
    base_prompt = (
        "儿童绘本插画风格，卡通风格，线条柔和，"
        "色彩明亮，温馨，适合儿童阅读，高清插画"
    )

    content_hint = story["title"]
    return f"{base_prompt}，主题：{content_hint}"

通过固定前缀，保证每次生成插图处于统一画风范围内。

五、多轮测试与优化

在测试过程中，逐步加入以下限制：

STYLE_LIMITS = [
    "避免写实风格",
    "避免黑暗或恐怖元素",
    "避免复杂背景",
    "避免过多角色"
]

最终将这些限制合并进固定提示词，使模型输出更加稳定。

六、优化效果对比

引入提示词约束后，插图在以下方面明显改善：

风格一致性显著提升
色彩和构图更适合儿童阅读
前端整体展示更加协调

七、小结

通过对文生图提示词进行工程化设计，而非简单文本拼接，本模块实现了对插图生成质量的有效控制，证明提示词在 AI 应用中的重要性。

posted @ 2025-12-14 17:04 元始天尊123 阅读(3) 评论(0) 收藏举报

刷新页面返回顶部

yuanshitianzun123

软件构造大作业——基于提示词约束的故事插图生成策略优化

软件构造大作业——基于提示词约束的故事插图生成策略优化

一、问题背景

二、设计目标

三、提示词结构设计

四、提示词构造完整实现

五、多轮测试与优化

六、优化效果对比

七、小结

公告