软件构造大作业——基于提示词约束的故事插图生成策略优化
软件构造大作业——基于提示词约束的故事插图生成策略优化
一、问题背景
在插图生成模块初期实现中,虽然系统能够成功生成图片,但生成结果的风格差异较大,部分图片偏写实、偏抽象,整体视觉效果不统一,与儿童绘本风格存在明显偏差。
该问题的根本原因在于文生图模型生成过程缺乏足够的风格约束。
二、设计目标
本模块的目标是:
- 固定插图的整体画风
- 降低模型生成结果的随机性
- 提高插图与故事内容的匹配度
三、提示词结构设计
系统采用“固定提示词前缀 + 故事摘要”的方式构造文生图提示词。
固定提示词用于控制风格,动态部分用于描述故事内容。
四、提示词构造完整实现
def build_image_prompt(story: dict) -> str:
base_prompt = (
"儿童绘本插画风格,卡通风格,线条柔和,"
"色彩明亮,温馨,适合儿童阅读,高清插画"
)
content_hint = story["title"]
return f"{base_prompt},主题:{content_hint}"
通过固定前缀,保证每次生成插图处于统一画风范围内。
五、多轮测试与优化
在测试过程中,逐步加入以下限制:
STYLE_LIMITS = [
"避免写实风格",
"避免黑暗或恐怖元素",
"避免复杂背景",
"避免过多角色"
]
最终将这些限制合并进固定提示词,使模型输出更加稳定。
六、优化效果对比
引入提示词约束后,插图在以下方面明显改善:
- 风格一致性显著提升
- 色彩和构图更适合儿童阅读
- 前端整体展示更加协调
七、小结
通过对文生图提示词进行工程化设计,而非简单文本拼接,本模块实现了对插图生成质量的有效控制,证明提示词在 AI 应用中的重要性。

浙公网安备 33010602011771号