文章详细介绍了通义大模型最新发布的 Wan2.2 视频生成模型。该模型在技术上引入了 MoE(混合专家)架构,通过高噪和低噪专家模型协同去噪,显著提升了视频生成质量和真实感。在艺术表现力方面,Wan2.2 通过扩充数据规模和专业美学深度训练,将电影工业的光影、构图、色彩等美学法则编码进模型,实现了电影级的视觉控制和精细的风格表现。此外,模型还通过全新的 VAE 架构,推出了 5B 轻量版,大幅减少显存占用,使得消费级显卡也能流畅运行,极大降低了用户的使用门槛。文章同时强调了 Wan2.2 在语义遵循、内容一致性和动态控制方面的提升,并结合“万能盒子”和“项目集”等 Web 功能,提供了便捷的创作体验,旨在让更多创作者轻松实现电影级视频创作。
src="https://api.eyabc.cn/api/picture/scenery/?k=2eca7868&u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FkfTykfMJicWNOvFsIudTAiaea3SXeibxaQt1lE8DEBSfAG2AFUDfy68axlrYeicBW2N7Ue53mdcthFVmUmjXydpSeQ%2F0%3Fwx_fmt%3Djpeg">



电影级视觉控制:对电影镜头语言的理解和还原,包含光影、色彩、构图等多维度的视觉呈现。画面风格多变,表现细腻。
大幅度运动:轻松还原各类复杂运动,并进一步强化运动的流畅度和可控性。
精准语义遵循:对复杂场景和多目标生成等语义理解和遵循更强,更好还原视频创作意图。
提示词:边缘光,中近景,人工光,侧光,低饱和度,暖色调,右侧重构图,过肩镜头角度拍摄,镜头聚焦一位穿着蓝白格子衬衫的外国女孩。她有着立体的五官,眼神专注明亮,几缕发丝从整齐的马尾辫中垂下,增添了一丝柔和感。女孩微微侧头,嘴唇微启,似乎在倾听对面的人说话。背景为昏暗虚化的房间,一台带有白色灯罩的复古台灯从画面一侧提供柔和光源,照亮人物轮廓。柜子旁的黑色木门隐约可见,强化了场景的神秘感与层次感。

抽卡成功率提升:在视频动态、指令遵循、一致性保持等维度全方面升级,更流畅更稳定的图生视频,抽卡成功率显著提升。
内容一致性:图片中的人物形象、文字、物体等内容特征,均可在视频动态过程中稳定保持。
动态过程控制:视频动态更加流畅、生动,动态程度更稳定、表现更自然。
精准指令遵循:更强更精准的指令遵循,简单提示词即可还原变化过程与运镜控制。

提示词:女人感觉到了一阵寒意,不自觉的拉了一下外套的领口。

高效短文本处理:简单提示词也可高效出图,在保障生成质量的前提下大幅提升创作效率。
精准指令理解:深度优化语义理解能力,生成效果高度契合画面布局、氛围及内容描述。
美学表现增强:优化构图、光影与美学表现,提升人物及动物表情生动性。
生成稳定性优化:减少生成尝试次数,提升生成品质与预期一致性。
多样化风格控制:支持吉卜力、水墨画等艺术风格,在保持风格稳定的前提下灵活创意主体动作。

提示词:写实风格,伦勃朗光艺术效果,近景中心视角,中心构图,穿着素色裙女孩站屋外墙边头偏一侧,有藤蔓小花,暖黄调,中等饱和度、高对比度、适中明度,开场聚焦女孩脸部并增亮光线,过渡环绕展示光影,结尾稍拉镜头显全貌。


Wan2.2 模型将 MoE(混合专家)架构实现到了视频生成扩散模型中!A14B 版本由高噪专家模型和低噪专家模型组成,考虑扩散模型的去噪过程存在阶段性差异,我们根据去噪时间步进行了专家模型划分——高噪声阶段关注生成视频的整体布局,低噪声阶段则更关注细节的完善。

Wan2.2 模型推理示意图
在生成视频时,噪声首先经过高噪专家模型进行前期去噪,再经过低噪专家模型进行后期去噪,高噪和低噪专家模型各自独立激活。因此 Wan2.2 生成的视频分布与真实视频差异更小,质量更高!


光有技术还不够,还得有"艺术细胞",相比于 Wan2.1,Wan2.2 在数据训练规模、专业美学训练实现了双重升级。
数据规模显著扩充:图像数据+65.6%、视频数据+83.2%,复杂场景表现力up up!
专业美学深度训练:模型引入了专门的美学精调阶段,通过细粒度训练,使视频生成的美学属性能够与用户给定的 Prompt(提示词)相对应。我们将电影工业的光影法则、构图原理、色彩心理学全部编码进模型,并通过强化学习技术进行深度微调,让模型真正理解并响应用户的美学需求。

想让普通用户也能用?必须解决显存问题!
Wan2.2 探索了一种模型体积更小、信息下降率更高的技术路径。Wan2.2 的 5B 轻量版采用全新 VAE 架构,在视频生成的特征空间实现了 16×16×4 的压缩比,有效减少了显存占用。

亮点:
-
单一模型可满足文生视频和图生视频两大核心任务需求
-
消费级显卡就能跑,让更多创作者能够轻松上手

Wan2.2 不仅在技术上实现突破,更在用户体验上全面升级!结合全新 Web 功能改版,从创作品质和创作效率两方面带来双重提升。

在升级版「万能盒子」中,你可以:输入一句话,生成高质量图像或动态视频;上传一张图,让静态画面“活”起来;快速迭代、多轮生成,激发无限灵感。
万能盒子地址:https://tongyi.aliyun.com/wanxiang/generate

在全新的「项目集」功能中,你可以以项目为单位管理素材,并在时间线上进行短片创作,快速生成、编辑、修改和剪辑视频,导出为最长1分钟的视频,让创作再无边界!
项目集视频创作:https://tongyi.aliyun.com/wanxiang/project
无论你是专业创作者还是 AI 绘画爱好者,Wan2.2 都能让你轻松实现电影级创作梦想。

