-
成本不到 150 元!李飞飞等 26 分钟训出个推理模型,媲美 o1 和 R1,秘诀:用蒸馏
李飞飞团队联合斯坦福大学、华盛顿大学等机构,通过蒸馏技术,以极低的成本(约 150 元)训练出一个名为 s1 的推理模型,该模型在数学和编程能力上表现媲美 DeepSeek-R1 和 OpenAI o1。团队使用阿里通义的 Qwen2.5-32B-Instruct 作为基础模型,通过蒸馏谷歌 DeepMind 的 Gemini 2.0 Flash Thinking 实验版得到 s1。为训练 s1,…- 0
- 0
低成本AI
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!


