全部标签

AI视频生

AI「视觉图灵」时代来了！字节 OmniHuman，一张图配上音频，就能直接生成视频

文章介绍了字节跳动数字人团队推出的 OmniHuman 技术方案，该方案基于单张图片和音频生成高质量的人像动画视频。OmniHuman 采用多模态混合训练策略（Omni-Conditions Training），结合扩散 Transformer 架构，能够处理不同人物占比、图片尺寸及风格的输入，并生成自然度高、动作匹配精准的视频内容。相比现有方法，OmniHuman 解决了高质量数据稀缺的问题，克…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
清华开源TurboDiffusion，AI视频生成速度暴增200倍，消费级显卡也能秒出大片！

近日，清华大学TSAIL实验室联合生数科技正式开源视频生成加速框架TurboDiffusion，这一突破性技术将AI视频扩散模型的推理速度提升100至200倍，同时保持视觉质量几乎无损，标志着AI视频创作正式进入实时生成时代。加速性能惊人:从分钟级到秒级生成TurboDiffusion针对现有开源视频生成模型（如Wan2.1和Wan2.2系列的1.3B至14B参数模型）进行了深度优化。在单张RTX…
AI 前线
- 0
- 0
探索X25年12月29日
清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

近日，清华大学 TSAIL 实验室联合生数科技推出了全新的开源视频生成加速框架TurboDiffusion。这一突破性的技术框架在确保视频生成质量不减的前提下，成功将端到端扩散生成的推理速度提升了100至200倍。AIbase 获悉，该框架为了实现极致的生成效率，集成了 SageAttention 和 SLA（稀疏线性注意力机制）。这些技术显著降低了模型在处理高分辨率视频内容时的计算开销。此外，开…
AI 前线
- 0
- 0
探索X25年12月29日
超详细提示词教程｜玩转 Wan2.2

本文为用户提供了通义万相 Wan2.2 文生视频模型的超详细提示词教程。文章首先介绍了基础、进阶及图生视频三种核心提示词公式，指导用户如何通过主体、场景、运动、美学控制和风格化等要素构建有效提示词。随后，文章深入剖析了影视级美学控制，包括光源、光线、时间段、景别、构图、镜头焦段与类型、人物情绪以及运动和基础运镜等多个维度，并为每个维度提供了丰富的提示词示例和对应的生成视频效果。旨在帮助用户提升 A…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日
通义万相 2.1 首尾帧模型开源！细节真实生动+过渡丝滑，指令遵循表现出色！

文章主要介绍了通义万相最新开源的首尾帧生视频模型。该模型基于 Wan2.1 文生视频 14B 大模型，用户只需提供视频的首帧和尾帧，模型即可自动生成一段 5 秒的 720p 高清视频，实现流畅自然的过渡效果。文章通过多个实际案例展示了该模型在不同场景下的应用效果，包括人像、动物、风景等，并着重强调了模型在细节复刻、动作真实性以及对提示词的遵循方面的出色表现。此外，文章还介绍了该模型的架构设计，采用…
AI 前线
- 0
- 0
勇敢牛牛25年12月22日

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部

{{userData.name}}已认证

AI视频生

AI「视觉图灵」时代来了！字节 OmniHuman，一张图配上音频，就能直接生成视频

清华开源TurboDiffusion，AI视频生成速度暴增200倍，消费级显卡也能秒出大片！

​清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍

超详细提示词教程｜玩转 Wan2.2

通义万相 2.1 首尾帧模型开源！细节真实生动+过渡丝滑，指令遵循表现出色！

清华开源 TurboDiffusion：AI 视频生成步入“秒级”时代，最高提速达 200 倍