-
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
DeepSeek 正式发布了 DeepSeek-R1 模型,该模型在数学、代码、自然语言推理等任务上性能对标 OpenAI o1 正式版。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力。DeepSeek 不仅开源了模型权重,还提供了 API 服务,允许用户通过设置 `model='deepseek-reasoner'` 调用思维链输出。此外…- 0
- 0
-
Qwen3-Coder:480B 参数的超强“代码特工”
文章详细介绍了通义大模型最新开源的 Qwen3-Coder,特别是其旗舰版本 Qwen3-Coder-480B-A35B-Instruct。该模型是拥有 480B 参数、35B 有效参数的 MoE(混合专家)模型,在代理式编程、浏览器智能操作和基础编码任务上均达到开源模型 SOTA。文章深入阐述了模型在预训练阶段的数据扩展(7.5T 高质量代码)、上下文扩展(原生 256K,最高 1M)以及合成数…- 0
- 0
-
50+ Claude 技能库闪现 GitHub,教你的 AI 学会9大领域专业活儿
随着 AI 从“对话”向“协作执行”转型,Anthropic 的技术生态迎来重要里程碑。近日,一套全面的 “Claude 技能”(Claude Skills) 库已在 GitHub 正式开源发布。这标志着 Claude 不再仅仅是一个回答问题的助手,而是一个拥有标准化、可定制工作流的专业执行器。50+ 技能矩阵:覆盖从文档到安全的全场景这套技能集包含9大类别、50多项专业技能,旨在教导 Claud…- 0
- 0
-
开源版 Operator 原生 AI 智能体来了?字节跳动开源 UI-TARS 模型
文章介绍了字节跳动开源的原生 GUI 智能体模型 UI-TARS,旨在解决通用大模型在图形用户界面交互中存在的精度、理解和效率问题。UI-TARS 模型具有四大创新点:GUI 增强感知、统一动作建模、System 2 推理和迭代式反思训练,并采用端到端智能体模型范式。通过与 OpenAI 的 Operator 和 Claude 等模型在 OSWorld 和 AndroidWorld 等基准测试上的…- 0
- 0
-
Ling-1T,智渊、思简
文章详细介绍了 Ling Team 推出的 Ling-1T 大模型,这是一款基于 Ling 2.0 架构的万亿参数开源旗舰非思考模型。该模型在复杂推理、代码生成、前端开发和跨领域泛化等任务上均达到 SOTA 水平,实现了高效推理与精准输出的平衡。Ling-1T 支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)提升推理能力。在训练方面,Ling-1T 是已知规模…- 0
- 0
开源AI
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!



