AI+绘画入门教程:基于 ChatGLM 的文生图与伪代码实现 - 教程

人工智能与计算机学院新媒体中心 陈牧函

摘要

本教程面向对AI绘画感兴趣对同学,以智谱清言(ChatGLM 系列模型)为实操平台,从 “文生图基础操作” 和 “伪代码生成实现” 两方面,构建 AI 绘画入门知识体系。通过简化的操作流程、通用提示词公式、Python 风格伪代码示例,辅助学习者快捷掌握 AI 绘画的核心逻辑与实践方法,无需深入技术原理即可完成创意生成。

关键词:AI 绘画;ChatGLM;文生图;伪代码;入门教程

1 引言

1.1 背景与意义

新手入门的理想选择。就是人工智能绘画(AI Painting)是通过自然语言描述(文本提示词)驱动算法生成图像的技术,已广泛应用于设计、创意表达、内容创作等领域。智谱清言作为搭载GLM-4大模型与 CogView4文生图模型的工具,支持中文友好交互、低门槛操作与代码调用,

1.2核心原理简化说明

AI 绘画本质是 “文本语义→图像像素” 的转化过程:模型通过海量图文资料训练,学会文字描述与视觉元素的对应关系,如同 “学霸” 根据 “重点”(提示词)做完绘画任务。ChatGLM采用 CogView4模型,支持原生中文理解、超长提示词输入与任意分辨率生成,特别适配中文用户需求。

2 文生图基础操作(智谱清言实操)

2.1 操作流程(3 步速成)

1.工具准备

    • 下载智谱清言 APP 或访问官网(chatglm.cn),完成手机号注册(免费版提供基础生成功能)
    • 进入 “创意生成” 模块(部分版本显示 “AI 作图”),选择 “文生图” 功能

2.提示词撰写(万能公式)

核心公式:画质词 + 主体描述 + 场景/背景 + 艺术风格 + 光影/细节

    • 示例 1(写实风格):高分辨率、复古胶片颗粒质感的画面,主体是染着浅金色短发的东亚年轻男性,身着黑棕拼色连帽夹克(左胸处带有发光的美元符号装饰),内搭印花上衣,叠戴多层闪钻项链,双手抬起调整夹克领口,同时佩戴金属戒指与银色手链;场景是夜晚城市高空视角下的模糊霓虹灯光背景;艺术风格为嘻哈音乐专辑封面风格、复古胶片摄影风格;光影细节是低光环境下的局部柔和补光,突出人物饰品的光泽与夹克的拼接质感,画面带有轻微暗角
    • 示例 2(二次元风格):最佳质量,二次元插画,粉色双马尾少女,洛丽塔裙子,手持气球,樱花背景,梦幻光斑,粗轮廓线
    • 反向提示词:输入不想要的元素,如低质量、畸形肢体、模糊、杂乱背景

2.参数调整与生成

新手推荐默认参数(无需手动修改),核心参数说明如下(进阶优化用):

参数名称

作用说明

推荐值(新手)

迭代步数

图像降噪优化次数(越多越精细但耗时久)

20-30 步

提示词相关性(CFG)

图像与提示词的匹配程度

7-11

分辨率

图像尺寸(避免过大导致变形)

1120*1120(默认)

采样器

图像生成算法(平衡速度与效果)

UniPC(快速优质)

点击 “生成” 按钮(耗时 3-15 秒),生成后可通过 “导出” 机制保存图片。

2.2 实操避坑指南

描述模糊→细化细节:将 “说唱歌手” 改为 “来自江油 锥形脸 带着墨镜 留着脏辫 28岁左右的说唱歌手”

风格混乱→明确风格:避免同时启用混乱的风格,例如 “写实+二次元”,优先选择单一风格词(如 “水墨风”“赛博朋克”)

画质粗糙→添加画质词:必加高质量、高清、细节精致等关键词提升效果

3 伪代码生成图片完成(Python 风格)

3.1 核心逻辑说明

伪代码是简化的编程逻辑描述,无需实际运行环境,旨在辅助理解 “代码如何驱动 AI 绘画”。ChatGLM 凭借 Python API 调用 CogView4 模型,核心流程为:导入工具(可以省略)→设置提示词→配置参数→生成图片→保存结果。

3.2 基础伪代码示例(入门级)

# 第一步:导入ChatGLM绘画程序(模拟工具调用,无需实际安装)

from chatglm_tools import ImageGenerator

# 第二步:初始化生成器(建立与AI模型的连接)

ai_painter = ImageGenerator()

# 第三步:定义提示词与核心参数(对应文生图的文字描述)

prompt = "4K高清,写实风格,白色萨摩耶犬,在雪地里奔跑,雪花飘落,蓝天背景,阳光明媚" # 正向提示词

negative_prompt = "低质量、模糊、多只狗、杂乱场景" # 反向提示词

params = {

"steps": 25, # 迭代步数

"cfg_scale": 8, # 提示词相关性

"resolution": "1120*1120" # 分辨率

}

# 第四步:调用AI生成图片

try:

# 发送生成请求,获取图片保存路径

image_path = ai_painter.generate(

prompt=prompt,

negative_prompt=negative_prompt,

**params

)

print(f"图片生成成功!保存位置:{image_path}")

except:

print("生成失败,请检查提示词或网络连接")

3.3 进阶伪代码示例(参数优化)

# 示例:生成带风格权重与分辨率调整的图片

from chatglm_tools import ImageGenerator

ai_painter = ImageGenerator()

# 带权重的提示词(突出核心特征)

prompt = "((中国古风:1.2),水墨风格,高山流水,一叶扁舟,烟雾缭绕,低饱和度)" # 括号提升权重10%

negative_prompt = "彩色、现代建筑、清晰轮廓"

# 进阶参数配置(自定义分辨率与风格)

advanced_params = {

"steps": 30,

"cfg_scale": 9,

"resolution": "1280*720", # 宽屏尺寸

"style_weight": 0.8, # 风格强度(0-1之间)

"seed": 12345 # 随机种子(相同种子生成相同图片,便于复现)

}

# 生成并保存

image_path = ai_painter.generate(

prompt=prompt,

negative_prompt=negative_prompt,

**advanced_params

)

print(f"高清古风图片已保存:{image_path}")

3.4 伪代码关键说明

  • 语法简化:忽略复杂的环境配置与错误处理,聚焦核心逻辑
  • 参数对应:伪代码中的prompt= 文生图的 “提示词”,params= 界面中的 “参数设置”
  • 可扩展性:若需生成多图,可添加循环语句(for i in range(3): 生成3张图片)

4 结论与实践建议

4.1 总结

1.文生图核心:精准提示词 + 合适参数,遵循 “画质 + 主体 + 风格 + 细节” 公式即可出图

2.伪代码逻辑:输入指令→配置参数→执行生成,与工具操作一一对应

3.ChatGLM 优势:中文友好、操作简便、支持代码调用,适合新手入门

4.2 实践建议

1.从模仿开始:复制教程示例提示词,修改主体或场景

2.积累关键词:收藏常用风格词(如 “油画风”“像素艺术”)与画质词,形成个人词库

3.尝试伪代码改写:将自己的文生图需求,转化为伪代码(如添加 “夜景” 元素到参数中)

参考文献

[1] 智谱清言官方帮助中心. AI 绘画功能使用指南 [EB/OL]. 2025.

[2] 人工智能绘画提示词撰写规范 [EB/OL]. CSDN 博客,2025.

[3] CogView4 模型技术白皮书 [EB/OL]. 智东西,2025.

posted @ 2025-12-23 18:44  clnchanpin  阅读(26)  评论(0)    收藏  举报