-
一文读懂|DeepSeek 新模型大揭秘,为何它能震动全球 AI 圈
本文深入剖析了 DeepSeek 最新发布的开源模型 R1,揭示了其在技术上的重大突破。DeepSeek R1 最核心的创新在于采用纯强化学习方法训练模型,使其自发涌现出强大的推理能力,这与传统依赖监督微调和复杂奖励模型的训练方式截然不同。R1-Zero 模型仅使用简单的准确性和格式奖励,就展现出“顿悟”式学习能力和优秀的跨领域迁移学习能力,在数学和编程竞赛中表现卓越。尽管 R1-Zero 存在可…- 0
- 0
-
离 GPT-5 最近的一次!中国 1 万亿参数开源巨兽突然爆火
文章详细介绍了月之暗面最新发布的开源模型 Kimi K2 Thinking。该模型采用 MoE 架构,总参数达 1 万亿,激活参数约 320 亿,具备 256K 的上下文窗口。其核心亮点在于强大的“思考 Agent 模型”能力,能在无人干预下连续调用工具 200-300 次,并通过“交替思考”机制实现连贯推理。在 BrowseComp、HLE 和 Tau2 Bench Telecom 等多项基准测…- 0
- 0
AI推理
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


