全部标签

自回归模型

【生成式人工智慧與機器學習導論 2025】第 9 講：影像和聲音上的生成策略 — Diffusion/Flow-matching 系列和接龍 (Autoregressive) 這兩條世界線的交會

文章详细阐述了生成式 AI 在影像和声音生成方面的最新进展。李宏毅教授首先展示了 Sora、Suno 等模型在视频、音乐生成上的惊人能力，并逐步引入技术核心。报告深入分析了像素与采样点作为基本单位的局限性，进而引出 Tokenization 的概念及其在语音和影像生成中的重要性。文章详细讲解了传统 Autoregressive 模型在影像生成上的应用，包括 MaskGIT 的非固定顺序生成策略以及…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日
何必 DiT！字节首次拿着自回归，单 GPU 一分钟生成 5 秒 720p 视频 | NeurIPS'25 Oral

文章详细介绍了字节跳动商业化技术团队提出的 InfinityStar 视频生成方法，该方法成功入围 NeurIPS'25 Oral。InfinityStar 旨在解决当前主流扩散模型（如 DiT）在视频生成领域计算复杂度高、资源消耗大的问题。作为首个在 VBench 上超越扩散模型的离散自回归视频生成器，InfinityStar 实现了视频生成质量和效率的兼顾，告别了传统扩散模型百步去噪…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部