模型介绍
Z-Image 是一个强大且高效的图像生成模型,拥有 6B 参数。目前有三个变体:
- 🚀 Z-Image-Turbo – Z-Image 的精简版,仅用 8 NFEs(函数评估次数)就能与领先的竞争对手匹敌或超越。它在企业级 H800 GPU 上提供 ⚡️亚秒级推理延迟⚡️,并且可以轻松适应 16G VRAM 消费设备。它在逼真图像生成、双语文本渲染(英语和中文)以及强大的指令遵循方面表现出色。
- 🧱 Z-Image-Base – 非精简的基础模型。通过发布这个检查点,我们旨在解锁社区驱动的微调和自定义开发的全部潜力。
- ✍️ Z-Image-Edit – 专门针对图像编辑任务进行微调的 Z-Image 变体。它支持创意的图像到图像生成,并具有令人印象深刻的指令遵循能力,允许基于自然语言提示进行精确编辑。
现阶段提供的模型为:
z_image_turbo_bf16.safetensors
使用方法
- 将z_image_turbo_bf16.safetensors放到ComfyUI\models\diffusion_models路径内
- text_encoders里面的qwen_3_4b.safetensors模型放到\ComfyUI\models\text_encoders路径内
- 还需要一个vae模型。和FLux的vae模型相同,可到下面链接下载ae.safetensors:
flux1-kontext-dev-fp8 图像编辑模型(非加速版本)-数字折叠
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END























暂无评论内容