AI+绘画入门教程:基于 ChatGLM 的文生图与伪代码实现 - 教程
人工智能与计算机学院新媒体中心 陈牧函
摘要
本教程面向对AI绘画感兴趣对同学,以智谱清言(ChatGLM 系列模型)为实操平台,从 “文生图基础操作” 和 “伪代码生成实现” 两方面,构建 AI 绘画入门知识体系。通过简化的操作流程、通用提示词公式、Python 风格伪代码示例,辅助学习者快捷掌握 AI 绘画的核心逻辑与实践方法,无需深入技术原理即可完成创意生成。
关键词:AI 绘画;ChatGLM;文生图;伪代码;入门教程
1 引言
1.1 背景与意义
新手入门的理想选择。就是人工智能绘画(AI Painting)是通过自然语言描述(文本提示词)驱动算法生成图像的技术,已广泛应用于设计、创意表达、内容创作等领域。智谱清言作为搭载GLM-4大模型与 CogView4文生图模型的工具,支持中文友好交互、低门槛操作与代码调用,
1.2核心原理简化说明
AI 绘画本质是 “文本语义→图像像素” 的转化过程:模型通过海量图文资料训练,学会文字描述与视觉元素的对应关系,如同 “学霸” 根据 “重点”(提示词)做完绘画任务。ChatGLM采用 CogView4模型,支持原生中文理解、超长提示词输入与任意分辨率生成,特别适配中文用户需求。
2 文生图基础操作(智谱清言实操)
2.1 操作流程(3 步速成)
1.工具准备
- 下载智谱清言 APP 或访问官网(chatglm.cn),完成手机号注册(免费版提供基础生成功能)
- 进入 “创意生成” 模块(部分版本显示 “AI 作图”),选择 “文生图” 功能
2.提示词撰写(万能公式)
核心公式:画质词 + 主体描述 + 场景/背景 + 艺术风格 + 光影/细节
- 示例 1(写实风格):高分辨率、复古胶片颗粒质感的画面,主体是染着浅金色短发的东亚年轻男性,身着黑棕拼色连帽夹克(左胸处带有发光的美元符号装饰),内搭印花上衣,叠戴多层闪钻项链,双手抬起调整夹克领口,同时佩戴金属戒指与银色手链;场景是夜晚城市高空视角下的模糊霓虹灯光背景;艺术风格为嘻哈音乐专辑封面风格、复古胶片摄影风格;光影细节是低光环境下的局部柔和补光,突出人物饰品的光泽与夹克的拼接质感,画面带有轻微暗角
- 示例 2(二次元风格):最佳质量,二次元插画,粉色双马尾少女,洛丽塔裙子,手持气球,樱花背景,梦幻光斑,粗轮廓线
- 反向提示词:输入不想要的元素,如低质量、畸形肢体、模糊、杂乱背景
2.参数调整与生成
新手推荐默认参数(无需手动修改),核心参数说明如下(进阶优化用):
参数名称 | 作用说明 | 推荐值(新手) |
迭代步数 | 图像降噪优化次数(越多越精细但耗时久) | 20-30 步 |
提示词相关性(CFG) | 图像与提示词的匹配程度 | 7-11 |
分辨率 | 图像尺寸(避免过大导致变形) | 1120*1120(默认) |
采样器 | 图像生成算法(平衡速度与效果) | UniPC(快速优质) |
点击 “生成” 按钮(耗时 3-15 秒),生成后可通过 “导出” 机制保存图片。
2.2 实操避坑指南
描述模糊→细化细节:将 “说唱歌手” 改为 “来自江油 锥形脸 带着墨镜 留着脏辫 28岁左右的说唱歌手”
风格混乱→明确风格:避免同时启用混乱的风格,例如 “写实+二次元”,优先选择单一风格词(如 “水墨风”“赛博朋克”)
画质粗糙→添加画质词:必加高质量、高清、细节精致等关键词提升效果
3 伪代码生成图片完成(Python 风格)
3.1 核心逻辑说明
伪代码是简化的编程逻辑描述,无需实际运行环境,旨在辅助理解 “代码如何驱动 AI 绘画”。ChatGLM 凭借 Python API 调用 CogView4 模型,核心流程为:导入工具(可以省略)→设置提示词→配置参数→生成图片→保存结果。
3.2 基础伪代码示例(入门级)
# 第一步:导入ChatGLM绘画程序(模拟工具调用,无需实际安装) from chatglm_tools import ImageGenerator # 第二步:初始化生成器(建立与AI模型的连接) ai_painter = ImageGenerator() # 第三步:定义提示词与核心参数(对应文生图的文字描述) prompt = "4K高清,写实风格,白色萨摩耶犬,在雪地里奔跑,雪花飘落,蓝天背景,阳光明媚" # 正向提示词 negative_prompt = "低质量、模糊、多只狗、杂乱场景" # 反向提示词 params = { "steps": 25, # 迭代步数 "cfg_scale": 8, # 提示词相关性 "resolution": "1120*1120" # 分辨率 } # 第四步:调用AI生成图片 try: # 发送生成请求,获取图片保存路径 image_path = ai_painter.generate( prompt=prompt, negative_prompt=negative_prompt, **params ) print(f"图片生成成功!保存位置:{image_path}") except: print("生成失败,请检查提示词或网络连接") |
3.3 进阶伪代码示例(参数优化)
# 示例:生成带风格权重与分辨率调整的图片 from chatglm_tools import ImageGenerator ai_painter = ImageGenerator() # 带权重的提示词(突出核心特征) prompt = "((中国古风:1.2),水墨风格,高山流水,一叶扁舟,烟雾缭绕,低饱和度)" # 括号提升权重10% negative_prompt = "彩色、现代建筑、清晰轮廓" # 进阶参数配置(自定义分辨率与风格) advanced_params = { "steps": 30, "cfg_scale": 9, "resolution": "1280*720", # 宽屏尺寸 "style_weight": 0.8, # 风格强度(0-1之间) "seed": 12345 # 随机种子(相同种子生成相同图片,便于复现) } # 生成并保存 image_path = ai_painter.generate( prompt=prompt, negative_prompt=negative_prompt, **advanced_params ) print(f"高清古风图片已保存:{image_path}") |
3.4 伪代码关键说明
- 语法简化:忽略复杂的环境配置与错误处理,聚焦核心逻辑
- 参数对应:伪代码中的prompt= 文生图的 “提示词”,params= 界面中的 “参数设置”
- 可扩展性:若需生成多图,可添加循环语句(for i in range(3): 生成3张图片)
4 结论与实践建议
4.1 总结
1.文生图核心:精准提示词 + 合适参数,遵循 “画质 + 主体 + 风格 + 细节” 公式即可出图
2.伪代码逻辑:输入指令→配置参数→执行生成,与工具操作一一对应
3.ChatGLM 优势:中文友好、操作简便、支持代码调用,适合新手入门
4.2 实践建议
1.从模仿开始:复制教程示例提示词,修改主体或场景
2.积累关键词:收藏常用风格词(如 “油画风”“像素艺术”)与画质词,形成个人词库
3.尝试伪代码改写:将自己的文生图需求,转化为伪代码(如添加 “夜景” 元素到参数中)
参考文献
[1] 智谱清言官方帮助中心. AI 绘画功能使用指南 [EB/OL]. 2025.
[2] 人工智能绘画提示词撰写规范 [EB/OL]. CSDN 博客,2025.
[3] CogView4 模型技术白皮书 [EB/OL]. 智东西,2025.
浙公网安备 33010602011771号