DeepSeek-V3 模型更新，各项能力全面进阶

AI 前线
25年12月23日
编辑

勇敢牛牛

DeepSeek V3 模型迎来小版本更新（V3-0324），主要在推理任务、前端开发能力、中文写作和搜索能力上进行了全面提升。在推理任务方面，新模型借鉴了 DeepSeek-R1 的强化学习技术，在数学和代码评测中取得了超过 GPT-4.5 的得分成绩。前端开发方面，HTML 代码生成质量更高，视觉效果更美观。中文写作方面，提升了中长篇文本创作质量。搜索能力方面，联网搜索结果更详实准确。此外，工具调用、角色扮演和问答闲聊等方面也有所提升。该版本模型参数约 660B，开源版本上下文长度为 128K，并采用 MIT License 许可协议。

DeepSeek V3 模型已完成小版本升级，目前版本号 DeepSeek-V3-0324，用户登录官方网页、APP、小程序进入对话界面后，关闭深度思考即可体验。API 接口和使用方式保持不变。

如非复杂推理任务，建议使用新版本 V3 模型，即刻享受速度更加流畅、效果全面提升的对话体验。

模型能力提升一览

推理任务表现提高

新版 V3 模型借鉴 DeepSeek-R1 模型训练过程中所使用的强化学习技术，大幅提高了在推理类任务上的表现水平，在数学、代码类相关评测集上取得了超过 GPT-4.5 的得分成绩。

新版 V3 模型的百科知识（MMLU-Pro, GPQA）、数学（MATH-500, AIME 2024）和代码任务（LiveCodeBench）表现均有提升

前端开发能力增强

在 HTML 等代码前端任务上，新版 V3 模型生成的代码可用性更高，视觉效果也更加美观、富有设计感。

DeepSeek-V3 模型更新，各项能力全面进阶

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序，包含若干可以调整重力、摩擦力等参数的滑动按钮，并以赛博朋克风格的 HTML 呈现

中文写作升级

在中文写作任务方面，新版 V3 模型基于 R1 的写作水平进行了进一步优化，同时特别提升了中长篇文本创作的内容质量。

DeepSeek-V3 模型更新，各项能力全面进阶

上下滑动查看完整内容

中文搜索能力优化

新版 V3 模型可以在联网搜索场景下，对于报告生成类指令输出内容更为详实准确、排版更加清晰美观的结果。

上下滑动查看完整内容

此外，新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

DeepSeek-V3 模型更新，各项能力全面进阶

模型开源

DeepSeek-V3-0324 与之前的 DeepSeek-V3 使用同样的 base 模型，仅改进了后训练方法。私有化部署时只需要更新 checkpoint 和 tokenizer_config.json（tool calls 相关变动）。模型参数约 660B，开源版本上下文长度为 128K（网页端、App 和 API 提供 64K 上下文）。V3-0324 模型权重下载请参考：

Model Scope:

https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324

Huggingface:

https://huggingface.co/deepseek-ai/DeepSeek-V3-0324

与 DeepSeek-R1 保持一致，此次我们的开源仓库（包括模型权重）统一采用 MIT License，并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。

{{userData.name}}已认证

DeepSeek-V3 模型更新，各项能力全面进阶

模型能力提升一览

模型开源

在 Claude 开发者平台上引入高级工具使用能力

藏师傅 Kimi K2 Thinking 首测！教你用 Kimi 编程全家桶

AI Agent 记忆系统：从短期到长期的技术架构与实践

如何画好一张架构图丨终极典藏版

【第 3639 期】反框架主义：选择原生 Web API，而非前端框架

Dify 从被低估到成为明星项目，到底做对了什么｜对谈 Dify 创始人路宇

终于有人说清楚 AI 开发的全流程了！

八年实战经验，解读 DDD 思想内核