-
DeepSeek-V3.1 发布,迈向 Agent 时代的第一步
DeepSeek 正式发布 V3.1 模型,核心亮点包括创新的混合推理架构,使其能同时支持“思考模式”与“非思考模式”,并能自由切换。新模型通过 Post-Training 优化,大幅增强了在编程智能体(SWE、Terminal-Bench)和搜索智能体(browsecomp、HLE)任务中的表现。在思考效率方面,V3.1-Think 模式在保持性能的同时,能将输出 token 数减少 20%-5…- 0
- 0
-
75%预训练数据都能删!Jeff Dean 新作:全自动筛除低质量数据
文章介绍了 Google DeepMind 提出的 DataRater 框架,旨在通过自动化方式评估并筛选预训练数据质量。针对大模型训练中数据质量参差不齐导致效率低下和性能受限的问题,DataRater 采用元学习和元梯度优化,学习识别数据对训练目标的价值。实验证明,DataRater 能有效减少训练计算量(在低质量数据集 Pile 上可移除高达 75%数据并节省 46.6%净计算),提升模型性能…- 0
- 0
-
OpenAI 研究员 Noam Brown:Mid-training 是新的 pre-training
文章介绍了 OpenAI 研究员 Noam Brown 关于 AI 模型训练和推理能力的前沿观点。Noam Brown 认为,推理能力是模型涌现出来的能力,只有当 pre-training 达到一定水平后,模型才能真正受益于额外的推理思考。他提出了 mid-training 的概念,认为这是新的 pre-training 阶段,而 post-training 则完成最终的细化与优化。文章详细探讨了…- 0
- 0
-
【早阅】用 Claude 编程:提示词入门
文章深入探讨了如何通过提示词工程优化大型语言模型(如 Claude)在特定任务上的表现。它强调了提示工程的迭代性,并详细介绍了构建高效提示的关键要素,包括明确的提示结构、提供任务和语气背景、利用背景细节(如 XML 标签组织固定信息)、应用小样本示例和对话历史。文章还提出了防止模型幻觉、优化推理顺序以及指定输出格式(如 JSON)的方法,以确保模型输出的准确性和可用性。通过一个汽车保险理赔的真实案…- 0
- 0
模型优化
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

