腾讯混元新一代快思考模型 Turbo S 发布

腾讯正式发布新一代快思考模型混元 Turbo S，该模型旨在实现更快的响应速度，首字时延显著降低。通过长短思维链融合，Turbo S 在保持文科类问题快速体验的同时，基于自研混元 T1 慢思考模型合成的长思维链数据，显著改进了理科推理能力。在架构上，Turbo S 创新地采用了 Hybrid-Mamba-Transformer 融合模式，有效降低了计算复杂度和成本。在多个公开 benchmark 上，Turbo S 在知识、数学和推理等领域展现出对标 DeepSeek V3、GPT 4o、Claude 等领先模型的效果。目前，Turbo S 已在腾讯云官网上架，并通过 API 提供给开发者和企业用户，腾讯元宝也将逐步灰度上线该模型。

混元 Turbo S 模型已在腾讯云官网上架，开发者和企业用户可以通过 API 调用；

腾讯元宝中即将逐步灰度上线，欢迎大家使用和体验。

腾讯混元新一代快思考模型 Turbo S 正式发布。

区别于 Deepseek R1、混元T1等需要“想一下再回答”的慢思考模型，混元 Turbo S 能够实现“秒回”，更快速输出答案，吐字速度提升一倍，首字时延降低44%。

在知识、数理、创作等方面，混元 Turbo S 也有不错表现。

有研究表明，人类约90%—95%的日常决策依赖直觉。慢思考更像理性思维，通过拆解逻辑提供解决问题的思路；快思考正如人的“直觉”，为大模型提供了通用场景下的快速响应能力。

快思考和慢思考的结合和补充，可以让大模型更智能、更高效地解决问题。

通过长短思维链融合，混元 Turbo S 在保持文科类问题快思考体验的同时，

基于自研混元 T1 慢思考模型合成的长思维链数据，显著改进了理科推理能力，实现模型整体性能明显提升。

在业界通用的多个公开 Benchmark 上，混元 Turbo S 在知识、数学、推理等多个领域，展现出对标 DeepSeek V3、GPT 4o、Claude等一系列业界领先模型的效果表现。

架构方面，创新采用 Hybrid-Mamba-Transformer 融合模式，混元Turbo S有效降低了传统 Transformer 结构的计算复杂度，减少了KV-Cache缓存占用，实现训练和推理成本的下降。

新的融合模式突破了传统纯 Transformer 结构大模型面临的长文训练和推理成本高的难题。一方面，发挥了 Mamba 高效处理长序列的能力；另一方面，也保

留 Transformer 擅于捕捉复杂上下文的优势，最终构建了显存与计算效率双优的混合架构。

这也是工业界首次成功将 Mamba 架构无损地应用在超大型MoE模型上。

通过模型架构上的技术创新，混元 Turbo S 部署成本大幅下降，持续推动大模型应用门槛降低。

作为旗舰模型，混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座，为推理、长文、代码等衍生模型提供基础能力。

基于 Turbo S，通过引入长思维链、检索增强和强化学习等技术，混元也推出了具备深度思考的推理模型 T1。

该模型此前已在腾讯元宝全量上线

（

腾讯混元T1模型面向所有用户开放

）

，用户可以选择Deepseek R1 或腾讯混元T1模型进行回答。

腾讯混元T1模型正式版也将很快上线，对外提供 API 接入等服务。

当前，开发者和企业用户已经可以在腾讯云上通过 API 调用腾讯混元 Turbo S ，即日起一周内免费试用。（腾讯混元turbos模型API免费试用申请：

https://cloud.tencent.com/apply/p/i2zophus2x8）

定价上，Turbo S 输入价格为0.8元/百万tokens，输出价格为2元/百万tokens，相比前代混元 Turbo 模型价格下降数倍。

腾讯元宝即将逐步灰度上线混元 Turbo S，用户在元宝内选择“Hunyuan” 模型并关闭深度思考即可体验使用。

{{userData.name}}已认证

腾讯混元新一代快思考模型 Turbo S 发布

谷歌终于登顶一次了！最强推理模型 Gemini 2.5 Pro 实测体验，真的有点东西

刚刚，阿里千问 APP 开启公测，要做中国版 ChatGPT | 附实测

GenAI 系统的隐性技术债

小龙虾社交，一个浪费算力的人造“僵尸网络”丨大声思考

MCP 集成

从 RAG 到 Context：2025 年 RAG 技术年终总结

从“氛围编码”到“氛围工程”——Kitze 与 Sizzy

从单体到 LLM：拆解 DevOps 进化的三大范式