-
首个 OpenAI 免费推理模型 o3-mini 发布!DeepSeek 让奥特曼反思:不开源我们错了
文章详细介绍了 OpenAI 发布的最新推理模型 o3-mini 系列,这是 OpenAI 首次向用户免费推出的推理模型,包括 low、medium 和 high 三个版本。o3-mini 在响应速度、数学、科学和编码能力等方面表现出色,尤其在高推理强度下超越了前代产品 o1-mini,同时降低了重大错误率。在与 DeepSeek 的竞争中,o3-mini 性能更强,但性价比仍逊一筹。文章还引用了…- 0
- 0
-
从 o1-mini 到 DeepSeek-R1,万字长文带你读懂推理模型的历史与技术
文章详细梳理了推理模型从 OpenAI 的 o1-mini 到 DeepSeek-R1 的发展历程,并深入探讨了其背后的技术原理。首先介绍了推理模型与标准 LLM 的区别,强调了长思维链在推理过程中的重要作用。接着,文章深入分析了如何通过强化学习训练推理模型,特别是利用可验证奖励进行训练的方法。此外,还探讨了推理时间策略,如思维链和解码技术,以及并行解码和自我优化等方法。文章重点介绍了 DeepS…- 0
- 0
-
让 OpenAI 只领先 5 天,百川发布推理新模型,掀翻医疗垂域开源天花板
文章详细介绍了百川智能最新发布的开源医疗推理大模型 Baichuan-M2-32B。该模型在 OpenAI 的 HealthBench 及 HealthBench Hard 评测集上,表现超越了包括 OpenAI 刚刚发布的 gpt-oss-120b 在内的多数顶尖开源与闭源模型,尤其在中国临床诊疗场景中展现出显著的本土化优势。文章强调了 Baichuan-M2 的低部署门槛,支持 RTX4090…- 0
- 0
-
阿里千问 3 推理模型重磅更新,比肩 Gemini-2.5 pro、o4-mini
文章详细介绍了阿里巴巴近期在开源大模型领域的重大进展。最新推出的千问 3 推理模型,其通用能力和深度思考能力实现巨大飞跃,支持 256K 上下文长度,并在知识、逻辑推理、编程、数学、人类偏好对齐等多项核心能力上,达到甚至超越 Gemini-2.5 pro、o4-mini 等顶尖闭源模型,被誉为全球最强开源推理模型。此外,阿里还开源了 Qwen3-235B-A22B-Instruct-2507 基础…- 0
- 0
-
OpenAI 发布最强推理模型 o3 和 o4-mini:图像深度思考首秀,还能自主调用工具
OpenAI 发布了两款新的推理模型 o3 和 o4-mini。o3 是目前最强大的推理模型,擅长编程、数学、科学和视觉理解等领域,在 Codeforces、SWE-bench 和 MMMU 等多项基准测试中创下新纪录,尤其擅长生物学、数学和工程领域。o4-mini 则更小巧高效,专为快速、低成本的应用场景优化,在非 STEM 任务上的表现超越了 o3-mini。这两款模型都具有自主工具调用能力,…- 0
- 0
-
刚刚,OpenAI 发布最强推理模型 o3!图像深度思考首秀,开源编程智能体已揽 5k+star
OpenAI 发布了最新的 o 系列模型 o3 和 o4-mini,这些模型在推理能力上有了显著提升,能够在响应之前进行更长时间的思考。o3 被认为是 OpenAI 迄今为止最智能的模型,尤其擅长多模态理解,能够像智能体一样使用和组合 ChatGPT 中的各种工具,包括互联网搜索、Python 分析、视觉输入推理和图像生成。o3 在 Codeforces、SWE-bench 等基准测试中取得了 S…- 0
- 0
-
通义千问推理模型 QwQ-32B,开源!
文章宣布通义千问开源了 QwQ-32B 推理模型。该模型在多个基准测试中表现出色,尤其在数学和编程能力上与 DeepSeek-R1 相当,在指令遵循和工具调用方面甚至超越了 DeepSeek-R1。文章介绍了该模型通过两轮大规模强化学习,分别针对数学和编程任务以及通用能力进行优化的过程。此外,QwQ-32B 还集成了与智能体 Agent 相关的能力,使其能够在使用工具的同时进行批判性思考。目前,该…- 0
- 0
推理模型
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!




