AI+绘画入门教程：基于 ChatGLM 的文生图与伪代码实现 - 教程

人工智能与计算机学院新媒体中心陈牧函

摘要

本教程面向对AI绘画感兴趣对同学，以智谱清言（ChatGLM 系列模型）为实操平台，从 “文生图基础操作” 和 “伪代码生成实现” 两方面，构建 AI 绘画入门知识体系。通过简化的操作流程、通用提示词公式、Python 风格伪代码示例，辅助学习者快捷掌握 AI 绘画的核心逻辑与实践方法，无需深入技术原理即可完成创意生成。

关键词：AI 绘画；ChatGLM；文生图；伪代码；入门教程

1 引言

1.1 背景与意义

新手入门的理想选择。就是人工智能绘画（AI Painting）是通过自然语言描述（文本提示词）驱动算法生成图像的技术，已广泛应用于设计、创意表达、内容创作等领域。智谱清言作为搭载GLM-4大模型与 CogView4文生图模型的工具，支持中文友好交互、低门槛操作与代码调用，

1.2核心原理简化说明

AI 绘画本质是 “文本语义→图像像素” 的转化过程：模型通过海量图文资料训练，学会文字描述与视觉元素的对应关系，如同 “学霸” 根据 “重点”（提示词）做完绘画任务。ChatGLM采用 CogView4模型，支持原生中文理解、超长提示词输入与任意分辨率生成，特别适配中文用户需求。

2 文生图基础操作（智谱清言实操）

2.1 操作流程（3 步速成）

1.工具准备

- 下载智谱清言 APP 或访问官网（chatglm.cn），完成手机号注册（免费版提供基础生成功能）
- 进入 “创意生成” 模块（部分版本显示 “AI 作图”），选择 “文生图” 功能

2.提示词撰写（万能公式）

核心公式：画质词 + 主体描述 + 场景/背景 + 艺术风格 + 光影/细节

- 示例 1（写实风格）：高分辨率、复古胶片颗粒质感的画面，主体是染着浅金色短发的东亚年轻男性，身着黑棕拼色连帽夹克（左胸处带有发光的美元符号装饰），内搭印花上衣，叠戴多层闪钻项链，双手抬起调整夹克领口，同时佩戴金属戒指与银色手链；场景是夜晚城市高空视角下的模糊霓虹灯光背景；艺术风格为嘻哈音乐专辑封面风格、复古胶片摄影风格；光影细节是低光环境下的局部柔和补光，突出人物饰品的光泽与夹克的拼接质感，画面带有轻微暗角
- 示例 2（二次元风格）：最佳质量，二次元插画，粉色双马尾少女，洛丽塔裙子，手持气球，樱花背景，梦幻光斑，粗轮廓线
- 反向提示词：输入不想要的元素，如低质量、畸形肢体、模糊、杂乱背景

2.参数调整与生成

新手推荐默认参数（无需手动修改），核心参数说明如下（进阶优化用）：

参数名称	作用说明	推荐值（新手）
迭代步数	图像降噪优化次数（越多越精细但耗时久）	20-30 步
提示词相关性（CFG）	图像与提示词的匹配程度	7-11
分辨率	图像尺寸（避免过大导致变形）	1120*1120（默认）
采样器	图像生成算法（平衡速度与效果）	UniPC（快速优质）

点击 “生成” 按钮（耗时 3-15 秒），生成后可通过 “导出” 机制保存图片。

2.2 实操避坑指南

描述模糊→细化细节：将 “说唱歌手” 改为 “来自江油锥形脸带着墨镜留着脏辫 28岁左右的说唱歌手”

风格混乱→明确风格：避免同时启用混乱的风格，例如 “写实+二次元”，优先选择单一风格词（如 “水墨风”“赛博朋克”）

画质粗糙→添加画质词：必加高质量、高清、细节精致等关键词提升效果

3 伪代码生成图片完成（Python 风格）

3.1 核心逻辑说明

伪代码是简化的编程逻辑描述，无需实际运行环境，旨在辅助理解 “代码如何驱动 AI 绘画”。ChatGLM 凭借 Python API 调用 CogView4 模型，核心流程为：导入工具（可以省略）→设置提示词→配置参数→生成图片→保存结果。

3.2 基础伪代码示例（入门级）

# 第一步：导入ChatGLM绘画程序（模拟工具调用，无需实际安装）

from chatglm_tools import ImageGenerator

# 第二步：初始化生成器（建立与AI模型的连接）

ai_painter = ImageGenerator()

# 第三步：定义提示词与核心参数（对应文生图的文字描述）

prompt = "4K高清，写实风格，白色萨摩耶犬，在雪地里奔跑，雪花飘落，蓝天背景，阳光明媚" # 正向提示词

negative_prompt = "低质量、模糊、多只狗、杂乱场景" # 反向提示词

params = {

"steps": 25, # 迭代步数

"cfg_scale": 8, # 提示词相关性

"resolution": "1120*1120" # 分辨率

}

# 第四步：调用AI生成图片

try:

# 发送生成请求，获取图片保存路径

image_path = ai_painter.generate(

prompt=prompt,

negative_prompt=negative_prompt,

**params

)

print(f"图片生成成功！保存位置：{image_path}")

except:

print("生成失败，请检查提示词或网络连接")

3.3 进阶伪代码示例（参数优化）

# 示例：生成带风格权重与分辨率调整的图片

from chatglm_tools import ImageGenerator

ai_painter = ImageGenerator()

# 带权重的提示词（突出核心特征）

prompt = "((中国古风：1.2)，水墨风格，高山流水，一叶扁舟，烟雾缭绕，低饱和度)" # 括号提升权重10%

negative_prompt = "彩色、现代建筑、清晰轮廓"

# 进阶参数配置（自定义分辨率与风格）

advanced_params = {

"steps": 30,

"cfg_scale": 9,

"resolution": "1280*720", # 宽屏尺寸

"style_weight": 0.8, # 风格强度（0-1之间）

"seed": 12345 # 随机种子（相同种子生成相同图片，便于复现）

}

# 生成并保存

image_path = ai_painter.generate(

prompt=prompt,

negative_prompt=negative_prompt,

**advanced_params

)

print(f"高清古风图片已保存：{image_path}")

3.4 伪代码关键说明

语法简化：忽略复杂的环境配置与错误处理，聚焦核心逻辑
参数对应：伪代码中的prompt= 文生图的 “提示词”，params= 界面中的 “参数设置”
可扩展性：若需生成多图，可添加循环语句（for i in range(3): 生成3张图片）

4 结论与实践建议

4.1 总结

1.文生图核心：精准提示词 + 合适参数，遵循 “画质 + 主体 + 风格 + 细节” 公式即可出图

2.伪代码逻辑：输入指令→配置参数→执行生成，与工具操作一一对应

3.ChatGLM 优势：中文友好、操作简便、支持代码调用，适合新手入门

4.2 实践建议

1.从模仿开始：复制教程示例提示词，修改主体或场景

2.积累关键词：收藏常用风格词（如 “油画风”“像素艺术”）与画质词，形成个人词库

3.尝试伪代码改写：将自己的文生图需求，转化为伪代码（如添加 “夜景” 元素到参数中）

参考文献

[1] 智谱清言官方帮助中心. AI 绘画功能使用指南 [EB/OL]. 2025.

[2] 人工智能绘画提示词撰写规范 [EB/OL]. CSDN 博客，2025.

[3] CogView4 模型技术白皮书 [EB/OL]. 智东西，2025.

posted @ 2025-12-23 18:44 clnchanpin 阅读(26) 评论(0) 收藏举报

刷新页面返回顶部