导航

在Mac下使用Draw Things跑Z-Image-Turbo文生图

Posted on 2025-12-10 14:50  蝈蝈俊  阅读(0)  评论(0)    收藏  举报

Z-Image-Turbo 是一款由阿里通义实验室开源的图像生成模型,最大的特点就是对普通电脑用户极其友好。它能让主流的游戏显卡就能生成高质量的图片。

https://huggingface.co/Tongyi-MAI/Z-Image-Turbo

它的特点如下:

  • 极低的硬件门槛:量化版本最低仅需 6GB 显存即可运行。
  • 极快的生成速度:采用8步采样技术,在消费级显卡上可实现秒级出图。
  • 出色的图像质量: 以60亿(6B)参数实现了媲美更大模型的照片级真实感,在皮肤、发丝、光影等细节上表现优异。
  • 强大的中文理解与文字渲染:对中文提示词理解精准,甚至有用户反馈用中文提示能获得更好效果。能在图片中准确生成中英文字符,适合做海报、Logo设计。
  • 丰富的控制与编辑能力:支持通过 “Z-Image-Edit”工具 用自然语言指令修改图片(如替换背景、调整表情)
  • 完全开源与免费:模型采用 Apache 2.0 协议在GitHub、Hugging Face等平台开源,允许个人和商业使用。零成本使用,没有次数限制,且有活跃社区提供大量教程、微调模型(LoRA)和资源

Mac下使用

之前我在Mac下尝试使用 ComfyUI 来配置,生成的图全黑(机器配置: Apple M4, 内存 24GB),没能走通,现在改用Draw Things,下载地址:

https://drawthings.ai/downloads/

其中的最新版本 1.20251207.0 就支持了 Z-Image。

软件安装完成后,打开需要下载对应模型:
这些模型被下载到 /Users/账号名/Library/Containers/com.liuliu.draw-things/Data/Documents 目录下:

  • 4.6G的 z_image_turbo_1.0_q6p.ckptZ Image Turbo 1.0 (6-bit)模型用的
  • 6GB的 z_image_turbo_1.0_q8p.ckpt文件是 Z Image Turbo 1.0模型用的
  • 4.53G的 qwen_3_vl_4b_instruct_q8p.ckpt文件,是文本理解器,将你输入的文字提示词(如“一只猫”)转化为模型能理解的数学表示,直接影响生成内容是否准确。

生成图期间,Draw Things 的内存消耗维持在6G左右,变化不大。

实际负载并不高

测试效果

模型:Z Image Turbo 1.0 (6-bit)
提示词:

一位年轻亚洲女子(演员:杨幂)在夜晚的温泉中放松身心,胸前仅围着一条薄薄的毛巾,表情羞涩又迷人,眼神带着诱惑,周遭蒸汽环绕,月光洒落在湿润的皮肤上,高质感8K,精致细节。

耗时: 89.07秒

模型:Z Image Turbo 1.0
提示词:

一张高分辨率的随机侧拍抓拍,拍摄的是一位颜值出众的年轻东亚女性,取景聚焦全身。她站在老旧居民楼的楼道门口,穿着浅粉色无袖针织吊带
和浅灰色运动短裤,脚上踩着一双磨白的米色人字拖,脚踝沾着些许水渍。楼道门口的水管
在滴水,她正弯腰用手接水玩,水花溅到小腿上,形成细小的水珠。她的头发扎成一个松散
的丸子头,几缕碎发被汗水粘在额头和颈后,侧脸线条流畅优美,嘴角上扬着,露出一抹随
性又甜美的笑容,眼神清亮如溪。周围环境十分平凡:身后是褪色掉漆的楼道铁门,墙面布
满污渍和小广告的残留痕迹,旁边堆着几个旧花盆和纸箱,光线是午后的侧逆光,脸部有些
轻微欠曝,画面因抓拍有轻微倾斜。但她的美貌极具冲击力,那种自然松弛的状态,让破旧
的环境反而成了衬托,完全让人忽略画面的不完美。

耗时:90.95秒

模型:Z Image Turbo 1.0
提示词:

中国风海报设计,春节主题,
标题文字"新春大吉",字体毛笔书法风格,
中心是红色灯笼和金色祥云,红金配色为主,
对称式构图,上下留白,
边框装饰有梅花图案和祥云纹样,
平面设计风格,精致细腻,
高清,矢量风格,商业设计水准

耗时:84.27秒

模型:Z Image Turbo 1.0
提示词:

一位白发老渔夫,在清晨的挪威峡湾,修补渔网。脸庞布满皱纹,眼神深邃,双手粗糙。晨雾弥漫,冷色调光线,超写实摄影,细节惊人,f/1.8大光圈。

耗时:83.45秒

模型:Z Image Turbo 1.0
提示词:

山区湖泊,秋季黄昏时分,
湖面倒映着远山和彩霞,天空有橙红色晚霞,
温暖的夕阳光线照亮山峰,金黄色调,
前景是湖边的枯木和石头,中景是平静的湖面,远景是层叠的山峦,
风光摄影风格,Ansel Adams安塞尔·亚当斯风格,
广角镜头,16-35mm,
高清,国家地理杂志水准,细节丰富

耗时:85.17秒

模型:Z Image Turbo 1.0
提示词:

未来感咖啡厅,内部充满巨大的、发光的植物。一个穿着霓虹夹克的人坐在柜台前。赛博朋克风格,强烈的霓虹灯光(蓝色与粉色)与深阴影对比,空气中可见的光尘,电影质感。

耗时:84.19秒

模型:Z Image Turbo 1.0
提示词:

图书馆的魔法大战,一位年轻法师用光之咒语对抗阴影怪物。书本在空中飞舞,书架倒塌。动态视角,充满动感和魔力粒子,史诗级奇幻艺术,Greg Rutkowski风格。

耗时:84.69秒

模型:Z Image Turbo 1.0
提示词:

从猫咪的视角仰望,巨大的家具,巨大的拖鞋。阳光透过窗户在地板上形成光斑,空气中飘着绒毛。超广角镜头,微距细节,温馨又梦幻,胶片质感。

耗时:84.97秒

从猫咪的视角仰望 这个没做到。

模型:Z Image Turbo 1.0
提示词:

“星际山水”:将中国宋代山水画的构图、笔触与墨韵,与银河星云、外星山峰相结合。水墨淡彩,留白处是星空,宁静而浩瀚。

耗时:84.98秒

带引号的理解成图上文字了。

模型:Z Image Turbo 1.0
提示词:

用液态金属和玻璃几何体构建的一只凤凰,正在展翅。背景是极简的渐变色。3D渲染,工作室灯光,高反光表面,干净、高级、概念艺术。

耗时:86.19秒

模型:Z Image Turbo 1.0
提示词:

一个打开的复古怀表,内部机械齿轮极其复杂精密,正在缓缓转动。表盘上雕刻着星空图。微距摄影,焦点在中央齿轮,黄铜与蓝钢质感,背景虚化。

耗时:90.59秒

数字有变形的

模型:Z Image Turbo 1.0
提示词:

一块正在融化的奶酪,拉出完美的、闪亮的丝线。背景是木制砧板和熟食。食物摄影,捕捉粘稠质感,戏剧性侧光,令人垂涎,超高清晰度。

耗时:83.19秒

模型:Z Image Turbo 1.0
提示词:

荒野女巫,她穿着由苔藓、树皮、干花和藤蔓编织的长袍,手持一根发芽的木杖。头发是飘逸的蕨类植物,眼神温柔而神秘。站在古老的森林中,概念角色设计,全身像。

耗时:88.14秒

模型:Z Image Turbo 1.0
提示词:

一座建在巨型海龟背上的蒸汽朋克风格移动城市,烟囱冒着烟,风帆展开。夕阳下,在海面上航行。广阔的场景,充满想象力,数字绘景,大师级构图。

耗时:82.57秒

总结

虽然有些图生成的有些缺陷,但是总的来说,Z-Image-Turbo 的核心价值在于它极大地 democratize(民主化)了高质量AI图像生成的能力,让技术不再是拥有顶级硬件用户的特权。