-
DeepSeek-R1 更新,思考更深,推理更强
DeepSeek 发布了其 R1 模型的小版本更新 DeepSeek-R1-0528,基于 DeepSeek V3 Base 基座,通过增强后训练显著提升了模型的思维深度和推理能力。新版本在数学、编程和通用逻辑等多项基准测试中表现优异,特别是在复杂推理任务如 AIME 2025 中准确率大幅提升。文章提到模型在解题过程中使用了更多 tokens 进行深入思考。此外,新版模型优化了幻觉问题,降低幻觉…- 0
- 0
-
迈向可信 AI:LLM 幻觉的分析与优化
本文深入探讨了 LLM 幻觉(即模型生成与事实不符或虚构信息)这一关键挑战。文章首先简要介绍了 LLM 的训练(预训练、后训练、对齐)和推理(分词、嵌入、Transformer 处理、采样)原理,解释了模型因概率性生成和训练数据限制而产生幻觉的内在原因。随后,详细分析了幻觉的优点(如创造性)和缺点(如误导用户、污染数据)。文章的核心在于提出了一系列多维度的优化方案,包括:通过精准无歧义的 Prom…- 0
- 0
AI优化
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!

