Wan2.2 开源：让每个像素都懂电影美学

AI 前线
25年12月23日
编辑

勇敢牛牛

文章详细介绍了通义大模型最新发布的 Wan2.2 视频生成模型。该模型在技术上引入了 MoE（混合专家）架构，通过高噪和低噪专家模型协同去噪，显著提升了视频生成质量和真实感。在艺术表现力方面，Wan2.2 通过扩充数据规模和专业美学深度训练，将电影工业的光影、构图、色彩等美学法则编码进模型，实现了电影级的视觉控制和精细的风格表现。此外，模型还通过全新的 VAE 架构，推出了 5B 轻量版，大幅减少显存占用，使得消费级显卡也能流畅运行，极大降低了用户的使用门槛。文章同时强调了 Wan2.2 在语义遵循、内容一致性和动态控制方面的提升，并结合“万能盒子”和“项目集”等 Web 功能，提供了便捷的创作体验，旨在让更多创作者轻松实现电影级视频创作。

src="https://api.eyabc.cn/api/picture/scenery/?k=2eca7868&u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FkfTykfMJicWNOvFsIudTAiaea3SXeibxaQt1lE8DEBSfAG2AFUDfy68axlrYeicBW2N7Ue53mdcthFVmUmjXydpSeQ%2F0%3Fwx_fmt%3Djpeg">

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 开源：让每个像素都懂电影美学

电影级视觉控制：对电影镜头语言的理解和还原，包含光影、色彩、构图等多维度的视觉呈现。画面风格多变，表现细腻。

大幅度运动：轻松还原各类复杂运动，并进一步强化运动的流畅度和可控性。

精准语义遵循：对复杂场景和多目标生成等语义理解和遵循更强，更好还原视频创作意图。

提示词：边缘光，中近景，人工光，侧光，低饱和度，暖色调，右侧重构图，过肩镜头角度拍摄，镜头聚焦一位穿着蓝白格子衬衫的外国女孩。她有着立体的五官，眼神专注明亮，几缕发丝从整齐的马尾辫中垂下，增添了一丝柔和感。女孩微微侧头，嘴唇微启，似乎在倾听对面的人说话。背景为昏暗虚化的房间，一台带有白色灯罩的复古台灯从画面一侧提供柔和光源，照亮人物轮廓。柜子旁的黑色木门隐约可见，强化了场景的神秘感与层次感。

Wan2.2 开源：让每个像素都懂电影美学

抽卡成功率提升：在视频动态、指令遵循、一致性保持等维度全方面升级，更流畅更稳定的图生视频，抽卡成功率显著提升。

内容一致性：图片中的人物形象、文字、物体等内容特征，均可在视频动态过程中稳定保持。

动态过程控制：视频动态更加流畅、生动，动态程度更稳定、表现更自然。

精准指令遵循：更强更精准的指令遵循，简单提示词即可还原变化过程与运镜控制。

Wan2.2 开源：让每个像素都懂电影美学

提示词：女人感觉到了一阵寒意，不自觉的拉了一下外套的领口。

Wan2.2 开源：让每个像素都懂电影美学

高效短文本处理：简单提示词也可高效出图，在保障生成质量的前提下大幅提升创作效率。

精准指令理解：深度优化语义理解能力，生成效果高度契合画面布局、氛围及内容描述。

美学表现增强：优化构图、光影与美学表现，提升人物及动物表情生动性。

生成稳定性优化：减少生成尝试次数，提升生成品质与预期一致性。

多样化风格控制：支持吉卜力、水墨画等艺术风格，在保持风格稳定的前提下灵活创意主体动作。

Wan2.2 开源：让每个像素都懂电影美学

提示词：写实风格，伦勃朗光艺术效果，近景中心视角，中心构图，穿着素色裙女孩站屋外墙边头偏一侧，有藤蔓小花，暖黄调，中等饱和度、高对比度、适中明度，开场聚焦女孩脸部并增亮光线，过渡环绕展示光影，结尾稍拉镜头显全貌。

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 模型将 MoE（混合专家）架构实现到了视频生成扩散模型中！A14B 版本由高噪专家模型和低噪专家模型组成，考虑扩散模型的去噪过程存在阶段性差异，我们根据去噪时间步进行了专家模型划分——高噪声阶段关注生成视频的整体布局，低噪声阶段则更关注细节的完善。

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 模型推理示意图

在生成视频时，噪声首先经过高噪专家模型进行前期去噪，再经过低噪专家模型进行后期去噪，高噪和低噪专家模型各自独立激活。因此 Wan2.2 生成的视频分布与真实视频差异更小，质量更高！

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 开源：让每个像素都懂电影美学

光有技术还不够，还得有"艺术细胞"，相比于 Wan2.1，Wan2.2 在数据训练规模、专业美学训练实现了双重升级。

数据规模显著扩充：图像数据+65.6%、视频数据+83.2%，复杂场景表现力up up！

专业美学深度训练：模型引入了专门的美学精调阶段，通过细粒度训练，使视频生成的美学属性能够与用户给定的 Prompt（提示词）相对应。我们将电影工业的光影法则、构图原理、色彩心理学全部编码进模型，并通过强化学习技术进行深度微调，让模型真正理解并响应用户的美学需求。

Wan2.2 开源：让每个像素都懂电影美学

想让普通用户也能用？必须解决显存问题！

Wan2.2 探索了一种模型体积更小、信息下降率更高的技术路径。Wan2.2 的 5B 轻量版采用全新 VAE 架构，在视频生成的特征空间实现了 16×16×4 的压缩比，有效减少了显存占用。

Wan2.2 开源：让每个像素都懂电影美学

亮点：

单一模型可满足文生视频和图生视频两大核心任务需求
消费级显卡就能跑，让更多创作者能够轻松上手

Wan2.2 开源：让每个像素都懂电影美学

Wan2.2 不仅在技术上实现突破，更在用户体验上全面升级！结合全新 Web 功能改版，从创作品质和创作效率两方面带来双重提升。

Wan2.2 开源：让每个像素都懂电影美学

在升级版「万能盒子」中，你可以：输入一句话，生成高质量图像或动态视频；上传一张图，让静态画面“活”起来；快速迭代、多轮生成，激发无限灵感。

万能盒子地址：https://tongyi.aliyun.com/wanxiang/generate

Wan2.2 开源：让每个像素都懂电影美学

在全新的「项目集」功能中，你可以以项目为单位管理素材，并在时间线上进行短片创作，快速生成、编辑、修改和剪辑视频，导出为最长1分钟的视频，让创作再无边界！

项目集视频创作：https://tongyi.aliyun.com/wanxiang/project

无论你是专业创作者还是 AI 绘画爱好者，Wan2.2 都能让你轻松实现电影级创作梦想。

Wan2.2 开源：让每个像素都懂电影美学

AI模型电影美学视频生成

【早阅】用 Claude 编程：提示词入门

2025-12-23 15:20:05

优化企业 AI 助手：Crypto.com 如何利用 LLM 推理和反馈来提升准确性和性能 | 亚马逊云服务

2025-12-23 15:20:12

0 条回复 A文章作者 M管理员

更换删除

暂无讨论，说说你的看法吧

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{data.mission.credit}}积分

今日签到

连续签到

1

训具身模型遇到的很多问题，在数据采集时就已经注定了丨鹿明联席 CTO 丁琰分享
1月10日
2

彻底被 Kimi 的新模型惊到了。
1月31日
3

144: 从「大而强」到「小而强」，密度法则、RL 的 Scaling Law 和智能的分布式未来
25年12月23日
4

3 个月达成 5 亿平台播放量，Wispr Flow 分享如何做好红人营销
1月18日
5

AI 智能体 (AI Agent) 如何大规模推动 Shopify 的产品分类体系进化 (2025)
25年12月23日
6

Claude Code 发现 Clawdbot 们套着它的壳就要把它替代了
1月31日

来自：

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部