成本不到 150 元!李飞飞等 26 分钟训出个推理模型,媲美 o1 和 R1,秘诀:用蒸馏 李飞飞团队联合斯坦福大学、华盛顿大学等机构,通过蒸馏技术,以极低的成本(约 150 元)训练出一个名为 s1 的推理模型,该模型在数学和编程能力上表现媲美 DeepSeek-R1 和 OpenAI o1。团队使用阿里通义的 Qwen2.5-… 赞 参与讨论{{item.data.meta.comment}}条讨论
成本不到 150 元!李飞飞等 26 分钟训出个推理模型,媲美 o1 和 R1,秘诀:用蒸馏 李飞飞团队联合斯坦福大学、华盛顿大学等机构,通过蒸馏技术,以极低的成本(约 150 元)训练出一个名为 s1 的推理模型,该模型在数学和编程能力上表现媲美 DeepSeek-R1 和 OpenAI o1。团队使用阿里通义的 Qwen2.5-… 赞 参与讨论{{item.data.meta.comment}}条讨论
作者: 成本不到 150 元!李飞飞等 26 分钟训出个推理模型,媲美 o1 和 R1,秘诀:用蒸馏 李飞飞团队联合斯坦福大学、华盛顿大学等机构,通过蒸馏技术,以极低的成本(约 150 元)训练出一个名为 s1 的推理模型,该模型在数学和编程能力上表现媲美 DeepSeek-R1 和 OpenAI o1。团队使用阿里通义的 Qwen2.5-… 赞 参与讨论{{item.data.meta.comment}}条讨论
成本不到 150 元!李飞飞等 26 分钟训出个推理模型,媲美 o1 和 R1,秘诀:用蒸馏 李飞飞团队联合斯坦福大学、华盛顿大学等机构,通过蒸馏技术,以极低的成本(约 150 元)训练出一个名为 s1 的推理模型,该模型在数学和编程能力上表现媲美 DeepSeek-R1 和 OpenAI o1。团队使用阿里通义的 Qwen2.5-… 赞 参与讨论{{item.data.meta.comment}}条讨论