DeepSeek V3 模型迎来小版本更新(V3-0324),主要在推理任务、前端开发能力、中文写作和搜索能力上进行了全面提升。在推理任务方面,新模型借鉴了 DeepSeek-R1 的强化学习技术,在数学和代码评测中取得了超过 GPT-4.5 的得分成绩。前端开发方面,HTML 代码生成质量更高,视觉效果更美观。中文写作方面,提升了中长篇文本创作质量。搜索能力方面,联网搜索结果更详实准确。此外,工具调用、角色扮演和问答闲聊等方面也有所提升。该版本模型参数约 660B,开源版本上下文长度为 128K,并采用 MIT License 许可协议。
模型能力提升一览
推理任务表现提高

新版 V3 模型的百科知识(MMLU-Pro, GPQA)、数学(MATH-500, AIME 2024)和代码任务(LiveCodeBench)表现均有提升
前端开发能力增强

动图展示了一个由模型生成的演示多个小球在指定空间范围内运动的 p5.js 程序,包含若干可以调整重力、摩擦力等参数的滑动按钮,并以赛博朋克风格的 HTML 呈现
中文写作升级



此外,新版 V3 模型在工具调用、角色扮演、问答闲聊等方面也得到了一定幅度的能力提升。

模型开源
https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324
Huggingface:
与 DeepSeek-R1 保持一致,此次我们的开源仓库(包括模型权重)统一采用 MIT License,并允许用户利用模型输出、通过模型蒸馏等方式训练其他模型。
