2阿里巴巴通义实验室今日正式开源 Z-Image-Turbo-Fun-Controlnet-Union,这款全新 ControlNet 模型标志着其 Z-Image 系列图像生成生态的重大扩展。作为 AIbase 独家追踪的开源 AI 动态,此次发布进一步强化了 Z-Image-Turbo 在精确控制与创意生成方面的领先优势,迅速引发全球开发者与创作者的热议。

模型已在 Hugging Face 平台上线,支持 Apache2.0许可,适用于商用场景。发布背景与技术基础Z-Image 系列自11月底首发以来,已迅速登顶 Hugging Face 趋势榜,首日下载量突破50万次。
该系列以单流扩散架构为核心,仅6亿参数却实现照片级真实感渲染,包括皮肤纹理、发丝细节及光影美学优化。Z-Image-Turbo 作为快速推理版本,仅需8步采样即可生成1024×1024分辨率图像,推理时间低至9秒(RTX4080硬件),并在提示词理解上支持中英混合文本渲染,显著提升了创作效率。

此次 Z-Image-Turbo-Fun-Controlnet-Union 的推出,是对 Z-Image-Turbo 的深度扩展。它在模型的6个核心块上集成 ControlNet 结构,兼容 Canny 边缘检测、HED 边界提取及 Depth 深度映射等多模态控制条件。该模型专为复杂场景设计,如人物姿态精确生成及基于线稿的建筑渲染,目前通过 Python 代码实现集成,ComfyUI 等工作流支持即将跟进。
核心功能与应用亮点
- 多条件控制融合:支持姿态、边缘与深度信息的联合输入,实现“零失真”图像操控。开发者可轻松构建从草图到成品的自动化管道,适用于电商视觉设计、影视特效及游戏原型制作。
- 高效兼容性:继承 Z-Image-Turbo 的轻量架构,仅需6GB VRAM 即可运行,远低于传统 ControlNet 模型的硬件门槛。测试显示,在低端 GPU 上生成速度达250秒/5步,平衡了质量与实时性。
- 开源生态赋能:模型提供4-bit 量化版本(如 MFLUX 兼容),便于 Mac 等消费级设备部署。同时,Z-Image-Edit 变体增强了复合编辑指令理解,保持画面一致性。
这些功能不仅降低了 AI 图像生成的门槛,还为非专业用户打开了专业级创作大门。社区反馈显示,该模型在广告素材生成中,提示词忠实度超越 OVIS Image 等竞品。
社区反响与未来展望开源社区对 Z-Image-Turbo-Fun-Controlnet-Union 的响应热烈,Reddit 与 X 平台上涌现大量基准测试,包括名人面部识别及 K-pop 偶像生成实验,结果显示其在辨识度与自然度上表现出色。开发者赞誉其“按着 Flux 打”的效率优势,尤其在低 CFG Scale(2-3)下的稳定输出。 AIbase 分析,此次发布强化了阿里巴巴在开源 AI 领域的全球竞争力。
未来,预计将与 Z-Image-Base 版本联动,形成完整图像生成-编辑-控制闭环。
Hugging Face :https://huggingface.co/alibaba-pai/Z-Image-Turbo-Fun-Controlnet-Union
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则