腾讯混元正式发布混元图像3.0图生图(HunyuanImage3.0-Instruct)模型。该模型目前已在腾讯旗下的 AI 助手“元宝”全端及腾讯混元官网同步上线,标志着腾讯在原生多模态图像处理领域取得新突破。
混元图像3.0图生图采用主流的混合专家(MoE)架构,总参数量达80B(激活参数约13B)。不同于传统的滤镜式修图,它被定义为一款“会思考”的图像编辑模型。在接收到用户的提示词和图片后,模型会先深度理解图像内容,随后自主推理出需要修改的区域和步骤,并精准保留无需变动的图像细节,从而实现更具逻辑感的输出效果。

在功能层面,该模型展现了极高的灵活性。它不仅支持基础的元素增删、风格变换及老照片修复,还具备强大的多图融合能力,能将多张照片中的人物或元素提取并合成。对于普通用户而言,这意味着可以直接在元宝上快速制作个性化表情包、虚拟合拍,甚至完成专业的电商海报设计和游戏角色定制。
为了打磨这一模型,混元团队构建了千万量级的图生图数据集,覆盖超过80个细分任务。通过引入思维链训练和自研的 MixGRPO 算法,模型在指令响应速度和图像一致性上均有显著提升。无论是在情绪表现力还是生成真实感上,混元图像3.0图生图都为 AI 图像创作提供了更专业、更易用的工具选择。
划重点:
🧠 自主推理编辑:混元图像3.0图生图能够先理解原图再执行指令,自动分析修改区域并保持非编辑区的一致性。
🎨 多场景功能覆盖:支持老照片修复、人物合影合成及复杂的文字修改,可广泛应用于电商海报、游戏定制等创意领域。
⚡ 性能与效率双增:基于80B MoE 架构及千万级数据集训练,模型生成的图像情绪张力更强,且生成速度较前代有明显提升。
.png)
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则