腾讯混元正式发布混元图像 3.0 图生图(HunyuanImage 3.0-Instruct)模型。该模型拥有 80B 总参数量,采用混合专家(MoE)架构,核心突破在于引入了图生图多任务数据与思维链(CoT)技术,使模型能够先理解图像内容并推理编辑步骤,再执行精准操作。模型支持增删改、风格变换、老照片修复及多图融合等 80 多种任务,显著提升了指令遵循度与图像一致性。目前该能力已在腾讯元宝全端及混元官网同步上线,面向社交、电商、游戏等场景提供创意支持。
混元图像3.0模型补上了重要一块能力版图——支持图生图了。
1月26日,腾讯混元发布混元图像3.0图生图(HunyuanImage 3.0-Instruct)模型,支持图片编辑与多图融合,并在「元宝」同步上线,用户可直接在元宝全端和在腾讯混元官网体验。
混元图像3.0图生图总参数量80B(激活参数约13B),采用混合专家(MoE)架构,基于混元图像3.0的原生多模态架构基础模型,引入图生图的多任务数据,通过指令微调和后训练,实现了对用户输入图像和编辑指令的深度理解与处理。混元图像3.0图生图指令遵循效果稳定,生成的图片一致性高、真实感强、情绪表现力佳,生成速度明显提升。
混元图像3.0图生图是一款能理解输入图像、会思考的图像编辑模型。模型在收到用户输入的图片和提示词后,首先会先理解图像内容本身,并基于用户的提示词进行推理,推理出具体的需要进行编辑的区域、详细的编辑步骤以及需要保留的图像区域,形成更加详细的编辑指令,实现良好的输出效果。


混元图像3.0图生图支持多样化的图片编辑与多图融合能力,比如增、删、改、风格变换、老照片修复、人物与文字修改等图片编辑能力,以及把多张照片中的人物或元素提取出来合成合照与生成新图片等。
在元宝上,基于该模型用户可以直接制作表情包、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制、创意图片制作等。
在数据层面,混元团队通过图像、视频原始数据挖掘和专家网络合成的方式,构建了千万量级的图生图数据,覆盖80+任务,并在持续训练(CT)阶段注入这些数据,使模型掌握基础编辑功能;同时,混元团队进一步针对图生图数据构造了思维链,让模型学会先分析用户图像和意图,输出更加详细的编辑指令提升编辑效果。后训练阶段,混元图像3.0图生图采用自研MixGRPO算法,结合奖励模型多轮迭代,高效对齐用户偏好,大幅提升了指令响应和非编辑区域保持一致的效果。
欢迎体验和反馈:混元官网体验入口(复制链接到浏览器或点击文末阅读原文直接访问):https://hunyuan.tencent.com/chat/HunyuanDefault?from=modelSquare&modelId=Hunyuan-Image-3.0-Instruct
以下是更多案例:
1、图片编辑
图片编辑场景中,混元图像3.0图生图可以按照用户的要求对图片中的光线、人物皮肤、背景等多种元素进行修改、增加或删除,适用于社交媒体美化或虚拟试妆;或者在图片中添加或修改文字,而不破坏整体布局。




2、风格变换
在风格变换场景中,用户可以上传一张普通照片,输入提示如“将这张照片转为像素风格”,模型会自动保持主体特征并转换风格,实现漫画/名画变真人或者真人变漫画的破次元壁效果;或者自动修复褪色或破损图像,添加色彩和细节。



3、多图融合
多图生图融合是另一个实用场景:比如用户上传2张图片,模型可按照用户的指令把它们融合成一张图。




上元宝,直接体验大模型p图:


