腾讯混元推出并开源其最新多模态图像生成模型 ——“混元图像3.0”(HunyuanImage3.0)。此次发布标志着该模型的参数规模已达到80B,成为首个开源的工业级原生多模态生成模型。官方表示,该模型的生成效果可以与业内领先的闭源模型相媲美。

腾讯发布并开源新一代生图模型“HunyuanImage3.0”

混元图像3.0的主要亮点在于其能够处理复杂的语义内容,解析千字级别的文本并生成相应的图像。通过对知识的推理,该模型能够生成长文本,这在以往的图像生成模型中是一个不小的突破。这项技术的进步不仅为用户带来了更为丰富的创作体验,也为 AI 图像生成领域带来了新的可能性。

此次更新是混元系列自今年5月推出2.0版本以来的重要升级。2.0版本已实现毫秒级的响应速度和超写实的图像质量,并支持实时生成图像,用户可以在输入文字的同时看到图像生成的过程。这种即时反馈的功能大大提升了用户的交互体验。

腾讯混元在过去的时间里已陆续开源了多项 AI 生成技术,包括3D 生成模型、定制化图像生成插件 InstantCharacter,以及多模态视频生成工具 HunyuanCustom。这些开源项目构建了一个完善的 AI 生成内容(AIGC)技术生态,使得开发者和用户能够在多个领域中进行探索与应用。

** 划重点:**  

🌟 混元图像3.0是腾讯开源的首个工业级多模态生成模型,参数规模达到80B。  

🖼️ 模型能够解析复杂的语义,并生成千字级长文本,效果可与顶尖闭源模型相媲美。  

🚀 这是继2.0版本后的升级,支持毫秒级响应和实时生成图像的交互体验。