全部标签

混合推理

全球首个混合推理模型：Claude 3.7 Sonnet 来袭，真实编码力压一切对手

Anthropic 发布了新型旗舰模型 Claude 3.7 Sonnet，这是一个混合推理模型，支持标准和扩展思考模式，并允许 API 用户控制思考时间。同时，Anthropic 还推出了智能编码工具 Claude Code，作为有限的研究预览版，旨在提升开发者的编码效率。Claude 3.7 Sonnet 在编码能力方面表现出色，在 SWE-bench Verified 上实现了 SOTA 性…
AI 前线
- 0
- 0
勇敢牛牛1月3日
Claude 3.7 Sonnet 和 Claude Code 【译】

Anthropic 发布了 Claude 3.7 Sonnet，这是一个混合推理模型，既能快速响应，也能进行分步骤的推理思考，提升了在数学、物理、编程等任务上的表现。其混合推理能力允许模型在标准模式下快速响应，在扩展思考模式下进行更深入的自省式推理。同时，还推出了 Claude Code，一个用于代理式编程的命令行工具，作为主动协作伙伴，能够搜索代码、编辑文件、编写测试并提交代码，例如在早期测试中…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
DeepSeek 上线两天后再回看：一次“小更新”，一场架构“豪赌”

文章深入分析了 DeepSeek V3.1 模型的最新更新。核心亮点并非简单的上下文扩展，而是其底层架构从分离式转向混合推理，旨在简化部署和提高算力利用效率。V3.1 在编程能力上取得显著进步，在 Aider 等基准测试中表现优异，并大幅增强了智能体（Agent）能力，尤其在软件工程和终端控制任务上实现跃迁。同时，通过思维链压缩训练，V3.1 显著降低了使用成本并提升了生成速度。然而，这种模型融合…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日
Qwen3 重磅开源！

文章主要介绍了 Qwen 系列全新一代的混合推理模型 Qwen3 的开源信息。Qwen3 在 GPQA、AIME24/25、LiveCodeBench 等多个权威评测中表现出极具竞争力的结果。通过引入创新的 MOE (混合专家) 架构，Qwen3 在效果上媲美上一代超大规模 Dense 模型的同时，效率显著提升，降低了计算成本。Qwen3 融合了推理与非推理能力，在逻辑分析和创意生成等任务中表现卓…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日

❯

个人中心

购物车

优惠劵

今日签到

有新私信私信列表

搜索

幸运之星正在降临...

点击领取今天的签到奖励！

恭喜！您今天获得了{{mission.data.mission.credit}}积分

今日签到

连续签到

{{item.credit}}

连续{{item.count}}天

查看所有

我的优惠劵

_✈_优惠劵

使用时效：无法使用

使用时效：
之前

使用时效：永久有效

优惠劵ID：
×

限制以下商品使用：限制以下商品分类使用：不限制使用：

[{{ct.name}}]

所有商品和商品类型均可使用

没有优惠劵可用!

购物车

×

删除

购物车空空如也!

清空购物车前往结算

您有新的私信

没有新私信

写新私信查看全部