-
阿里再开源,全球首个 MoE 视频生成模型登场,电影级美学效果一触即达 | 机器之心
文章宣布了阿里巴巴开源了全球首个基于 MoE(专家混合)架构的视频生成模型 Wan2.2,并遵循 Apache 2.0 开源协议。该模型的最大亮点在于其电影级美学控制能力。Wan2.2 的核心技术创新包括:首次在视频扩散模型中引入 MoE 架构,通过专家模型分担去噪过程,在不增加计算成本的前提下大幅扩展了模型容量;训练数据量相比前代大幅提升,显著增强了模型在运动表达、语义理解和美学表现等多维度的泛…- 0
- 0
-
抢跑 GPT-5,智谱开源新 SOTA 模型,一句话搞出能看视频、发弹幕的 B 站!
在业界普遍关注 GPT-5 发布之际,智谱发布了新一代旗舰开源大模型 GLM-4.5,采用 MoE 架构,总参数量达 3550 亿。该模型在代码和 Agent 能力上取得开源 SOTA,推理能力位居开源第二,并首次原生融合这三项能力。GLM-4.5 具备极快的生成速度和低廉的 API 调用价格,通过实际案例展示了其强大的代码生成和应用构建能力,如一句话生成可交互的百度、小红书、B 站等。文章还介绍…- 0
- 0
-
DeepSeek-V3 正式发布
DeepSeek-V3 是 DeepSeek 公司最新发布的自研 MoE 模型,拥有 671B 参数,激活 37B,并在 14.8T token 上进行了预训练。该模型在多项评测中表现优异,超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型,并在性能上与 GPT-4o 和 Claude-3.5-Sonnet 等顶尖闭源模型不相上下。DeepSeek-V3 在百科知识、…- 0
- 0
MoE模型
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


