-
大模型如何推理?斯坦福 CS25 重要一课,DeepMind 首席科学家主讲 | 机器之心
文章深入解读了 Google DeepMind 首席科学家 Denny Zhou 在斯坦福大学 CS25 课程中对大语言模型推理能力的权威观点。他提出 LLM 推理的关键在于生成一系列中间 token,而非简单地扩展模型规模,这种机制使 Transformer 模型能变得极其强大。文章阐述了预训练模型本身已具备推理能力,但需要通过链式推理解码、提示技巧(如思维链)、监督微调(SFT)以及当前最强大…- 0
- 0
-
刚刚,DeepSeek-R1 论文登上 Nature 封面,通讯作者梁文锋 | 机器之心
文章报道了 DeepSeek-R1 研究登上《Nature》封面,强调了其在利用强化学习提升大语言模型(LLM)推理能力方面的创新。DeepSeek-R1 模型通过群组相对策略优化(GRPO)和精巧的奖励设计,使模型能够自我验证和反思,逐步解决复杂问题,显著提高了在编程和科学问题上的表现。文章特别指出,DeepSeek-R1 是首个通过权威学术期刊同行评审的大语言模型,这一“程序价值”被视为 AI…- 0
- 0
-
阶跃星辰发布新一代基模 Step 3,推理效率创行业新高
阶跃星辰在 WAIC 2025 前夕发布了新一代基础大模型 Step 3,旨在成为推理时代最适合应用的模型。该模型是首个全尺寸、原生多模态推理模型,采用 MoE 架构,总参数量 321B,激活参数量 38B,在多个开源多模态推理榜单上取得了 SOTA 成绩。文章强调 Step 3 兼顾性能与极致成本效益,通过系统架构创新显著提升了推理解码效率,尤其在国产芯片上表现优异。此外,阶跃星辰还联合芯片和平…- 0
- 0
大模型推理
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



