混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

文章介绍了腾讯混元最新发布的 Hunyuan3D-PolyGen,一款业界首个美术级 3D 生成大模型。该模型旨在解决当前 3D 生成算法在游戏开发等专业管线中面临的面数过高、布线质量欠佳和编辑难度大等核心痛点。Hunyuan3D-PolyGen 采用自回归网格生成框架,并通过两项关键技术创新实现突破:一是自研高压缩率表征 BPT(Blocked and Patchified Tokenization),该技术能将 mesh 的 token 数量压缩 74%,从而支持生成面数达上万面的复杂几何模型,显著提升细节表现力;二是引入强化学习后训练框架,有效提升了 mesh 自回归生成的稳定性,确保模型输出结果的一致性和高质量。文章通过与现有 SOTA 方法及业界重拓扑接口的对比,展示了 Hunyuan3D-PolyGen 在布线质量、细节保持和智能面数分配方面的优势。该能力已上线腾讯混元 3D AI 创作引擎,并集成到腾讯多个游戏管线,声称可助力美术师建模效率提升超 70%,为 UGC 游戏资产生成提供了新的解决方案。




src="https://api.eyabc.cn/api/picture/scenery/?k=ac25a9f5&u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2F9u3YmmgmjbTQdAQM0QZ4FcPsA5chqaxduZ81vyyGyibRsYQPRmKr8C6QkRSpv6fib4D7Mcs4E4tibotUnqic1ibFPPQ%2F0%3Fwx_fmt%3Djpeg">

今天,腾讯混元3D再次升级,带来了业界首个美术级3D生成大模型Hunyuan3D-PolyGen

结合自研高压缩率表征BPT技术,该模型可生成面数达上万面的复杂几何模型,布线精度更高,细节更丰富,同时支持三边面和四边面,满足不同专业管线需求。基于此,混元3D资产可无缝应用于UGC游戏资产生成,显著提升美术师建模效率。

目前,该能力已上线腾讯混元 3D AI 创作引擎(体验地址3d.hunyuan.tencent.com,欢迎体验,该技术也集成到腾讯多个游戏管线,助力美术师建模效率提升超70%

模型主要是为解决3D资产生成中布线质量和复杂物体建模的难题,提升美术师建模效率。

当前,3D生成算法在几何建模方面已取得显著进展,但生成的模型与美术制作的专业标准仍存在明显差距,难以直接应用于游戏开发等专业管线。

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

1. 3D生成Mesh vs 美术Mesh

主要问题体现在以下三个方面:

  • 面数过高:生成网格(Mesh)的面片数量动辄高达数十万,无法满足游戏实时加载与渲染的需求。

  • 布线质量欠佳:网格布线杂乱无章,影响模型美观度,并对后续的UV展开、骨骼绑定等环节造成阻碍。

  • 编辑难度大:生成结果为单一整体网格,难以拆分,限制了美术师的后期编辑能力。


为解决以上问题,PolyGen做了一系列的技术创新。

1.算法框架

为实现从可看可用3D生成,Hunyuan3D-PolyGen采用自回归网格生成框架,通过显式、离散的顶点与面片建模,进行空间推理,生成高质量、符合美术规范的3D模型。其核心框架(见图2)包括以下三个步骤:

  • 网格序列化:将网格的顶点和面片转化为Token序列,用以表示Mesh结构。

  • 自回归建模:以点云作为输入Prompt,利用自回归模型生成MeshToken序列。

  • 序列解码:将生成的Token序列反向解码为顶点与面片,重建3D网格。

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

2. Mesh自回归生成框架

2.技术难点与解决方案

难点一:对于复杂物体的建模

解决方案:自研高压缩率表征BPT

现有的mesh自回归方法,表达一个面通常需要9token(一个面片三个顶点,每个顶点三个坐标),mesh表达冗余程度高,在给定有限的上下文窗口下,仅可对低面片(2k面以下)的简单模型进行建模,为了提升可建模面数,实现复杂mesh建模,我们自研了高压缩率mesh表征BPTBlocked and Patchified Tokenization),设计block索引和patch压缩,使表达相同 mesh 所需的token序列更短,如下图所示

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

3. 自研高压缩率mesh表征BPT

1)  block索引:将网格空间分成多个block,顶点的表征由(x,y,z)空间坐标转化为(block, offset)索引坐标,token数量可降低33%

2)  patch压缩:将相邻面片组成patch(一个中心顶点和边缘顶点),减少相邻面片之间共用顶点的冗余,结合共享block等技巧,token数量可进一步降低约41%

利用以上压缩算法BPT表征meshtoken数量可压缩74%,即平均用2.3token即可表征一个面,极大提升了模型的可建模面数,由下图可看出,对比现有mesh自回归方法,可建模的模型更加复杂(可达2w+面),细节更多。

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

4. 混元3D-PolyGen与现有SOTA方法可建模复杂度对比

难点二:mesh自回归生成稳定性低

解决方案:引入强化学习后训练

mesh自回归生成的另一个重大的挑战是生成的稳定性低,同一个模型的多次生成结果可能有较大差异,如图5所示。这其中包含两方面原因:一方面是mesh生成的容错率低,生成一个错误的坐标可能就会导致整体的生成失败;另一方面是meshtoken序列较长(可达上十万),更容易产生错误。

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

5. mesh自回归生成存在稳定性差问题,同一个模型生成结果差异较大

为此,我们研发了mesh自回归的强化学习后训练框架(如图6所示),在预训练模型的基础上进行后训练,设计稳定生成和美术规范奖励来引导模型生成更好的结果。通过强化学习,可以提升模型生成好结果的概率,降低模型生成差结果的概率,从而提升了模型生成的稳定性。

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

6. 混元3D-PolyGen强化学习后训练模块

效果对比

1.Hunyuan3D-PolyGen vs Mesh自回归SOTA算法

mesh自回归方法在生成复杂物体时容易出现破损、细节丢失、布线杂乱等问题,相比之下,混元3D-PolyGen在生成的稳定性、细节、布线质量等方面均优于目前SOTA模型。

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

7. Hunyuan3D-PolyGenSOTA方法效果对比

2.    Hunyuan3D-PolyGen vs 业界重拓扑接口

为了解决前面提到的面数和布线问题,业界通常采用传统的图形学重拓扑算法对布线进行优化,现有重拓扑方法虽然能生成相对规整的布线,但其面片大小分布均匀,在给定较低面数时,会导致细节丢失。相比竞品的重拓扑/AI拓扑方法,混元3D-PolyGen可根据几何结构自适应分配面数可利用更低的面数实现更好的细节

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

8. 相比于业界的重拓扑/AI拓扑算法,Hunyuan3D-PolyGen可以智能分配面数,达到更好的细节。

效果对比:

输入图

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

效果

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

输入图

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

效果

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

输入图

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

效果

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

体验入口:

1.首页"3D智能拓扑

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量


2.
实验室->3D智能拓扑

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

3.首页文生3D“"图生3D”选择几何、纹理分阶段,在生成几何模型后,可选择智能拓扑

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

混元 3D 再升级,推出业界首个美术级 3D 生成大模型,大幅提升布线质量

点击👇阅读原文,即刻体验。


AI 前线

生产数据库泄露、P0 重大事故!我劝你不要把 AI 用在 DevOps 上……

2025-12-23 12:55:20

AI 前线

独家 | 与李想的 3 小时对谈(完整版)

2025-12-23 12:55:41

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索