-
DeepSeek-R1 发布,性能对标 OpenAI o1 正式版
DeepSeek 正式发布了 DeepSeek-R1 模型,该模型在数学、代码、自然语言推理等任务上性能对标 OpenAI o1 正式版。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术,极大提升了模型推理能力。DeepSeek 不仅开源了模型权重,还提供了 API 服务,允许用户通过设置 `model='deepseek-reasoner'` 调用思维链输出。此外…- 0
- 0
-
Qwen3-Coder:480B 参数的超强“代码特工”
文章详细介绍了通义大模型最新开源的 Qwen3-Coder,特别是其旗舰版本 Qwen3-Coder-480B-A35B-Instruct。该模型是拥有 480B 参数、35B 有效参数的 MoE(混合专家)模型,在代理式编程、浏览器智能操作和基础编码任务上均达到开源模型 SOTA。文章深入阐述了模型在预训练阶段的数据扩展(7.5T 高质量代码)、上下文扩展(原生 256K,最高 1M)以及合成数…- 0
- 0
-
50+ Claude 技能库闪现 GitHub,教你的 AI 学会9大领域专业活儿
随着 AI 从“对话”向“协作执行”转型,Anthropic 的技术生态迎来重要里程碑。近日,一套全面的 “Claude 技能”(Claude Skills) 库已在 GitHub 正式开源发布。这标志着 Claude 不再仅仅是一个回答问题的助手,而是一个拥有标准化、可定制工作流的专业执行器。50+ 技能矩阵:覆盖从文档到安全的全场景这套技能集包含9大类别、50多项专业技能,旨在教导 Claud…- 0
- 0
-
深度|Meta 首席科学家 LeCun:Meta 正研究新一代 Agentic 系统,能够理解物理世界并规划行动实现目标
Meta 首席科学家 Yann LeCun 在本文中详细介绍了 Meta 正在研究的新一代 Agentic 系统,该系统旨在通过观察和行动来理解物理世界,并规划行动以实现目标。LeCun 强调了当前大语言模型(如 GPT)的性能已接近天花板,未来的 AI 系统将需要新的架构和方法,超越简单的文本预测。他还讨论了开源 AI 平台的重要性,认为开源能够促进技术进步和全球协作,同时反对过度监管 AI 研…- 0
- 0
-
Meta 深夜开源 Llama 4!首次采用 MoE,惊人千万 token 上下文,竞技场超越 DeepSeek
Meta 发布了最新的 Llama 4 系列 AI 模型,包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。这些模型采用混合专家 (MoE) 架构,显著提升训练和推理效率,具备多模态能力,支持多种语言,并在多个基准测试中表现出色。Llama 4 Scout 拥有 170 亿激活参数和 10M token 超长上下文窗口,为业界领先,解锁了围绕…- 0
- 0
-
阿里深夜开源 Qwen2.5-VL 新版本,视觉推理通杀,32B 比 72B 更聪明
阿里通义千问团队开源了 Qwen2.5-VL-32B-Instruct 多模态模型,该模型在回复人类偏好、数学推理和图像细粒度理解与推理方面进行了改进,尤其适用于 AI Agent 部署。通过与 Mistral-Small-3.1-24B、Gemma-3-27B-IT 等模型的对比,Qwen2.5-VL-32B-Instruct 在 MMMU、MMMU-Pro 和 MathVista 等多模态任务…- 0
- 0
-
DeepSeek 绝不仅仅是开源的胜利
文章深入分析了 DeepSeek 爆火的原因,指出其成功并非仅因模型性能媲美 OpenAI 或成本更低,更重要的是其开源策略加速了 AI 技术的普及。文章探讨了开源与闭源模式在大语言模型领域的差异,强调了开源在降低推理成本、提升开发者灵活性和促进社区贡献方面的价值。DeepSeek 的技术创新,如混合质量模型 Moe、多头潜在注意力机制 MLA 等,降低了对硬件的需求,影响了 AI 基础设施。文章…- 0
- 0
-
达摩院开源 VideoLLaMA3:仅 7B 大小,视频理解拿下 SOTA | 在线可玩
本文介绍了达摩院开源的 VideoLLaMA3,这是一个以图像为中心构建的新一代多模态视频 - 语言模型。该模型仅有 7B 大小,在通用视频理解、时间推理和长视频理解三个核心维度评估中表现优异。同时,适用于端侧的 2B 版本在图像理解上也表现出色,在 InfoVQA 和 MathVista 等基准测试中取得领先。文章详细阐述了 VideoLLaMA3 以图像为中心的训练范式,包括视觉编码器适配、视…- 0
- 0
-
DeepSeek-V3 深夜惊爆上新!代码数学飙升剑指 GPT-5,一台 Mac 可跑
文章报道了 DeepSeek V3 最新版本 DeepSeek-V3-0324 的发布及其性能提升。该模型在代码和数学推理能力上均有显著提升,甚至在代码方面可以与 Claude 3.7 相媲美。尤其在前端开发等特定任务中,DeepSeek V3 展现出超越其他模型的潜力。此外,DeepSeek V3 采用 MIT 开源协议,允许自由修改和商业应用。该模型可在消费级设备上运行,如苹果 M3 Ultr…- 0
- 0
-
准确率 92.7%逼近 Claude 3.5、成本降低 86%,开源代码定位新神器 LocAgent 来了 | 机器之心
本文详细介绍了由 OpenHands 等机构提出的 LocAgent 框架,一个专用于大规模代码库代码定位的图索引 LLM Agent。针对自然语言问题描述与实际代码位置间的语义和结构差异难题,LocAgent 通过将代码库构建为包含丰富依赖关系的异构图,并提供 SearchEntity、RetrieveEntity、TraverseGraph 等工具接口供 LLM Agent 调用。Agent …- 0
- 0
-
开源版 Operator 原生 AI 智能体来了?字节跳动开源 UI-TARS 模型
文章介绍了字节跳动开源的原生 GUI 智能体模型 UI-TARS,旨在解决通用大模型在图形用户界面交互中存在的精度、理解和效率问题。UI-TARS 模型具有四大创新点:GUI 增强感知、统一动作建模、System 2 推理和迭代式反思训练,并采用端到端智能体模型范式。通过与 OpenAI 的 Operator 和 Claude 等模型在 OSWorld 和 AndroidWorld 等基准测试上的…- 0
- 0
-
Ling-1T,智渊、思简
文章详细介绍了 Ling Team 推出的 Ling-1T 大模型,这是一款基于 Ling 2.0 架构的万亿参数开源旗舰非思考模型。该模型在复杂推理、代码生成、前端开发和跨领域泛化等任务上均达到 SOTA 水平,实现了高效推理与精准输出的平衡。Ling-1T 支持最高 128K 上下文窗口,通过“中训练+后训练”的演进式思维链(Evo-CoT)提升推理能力。在训练方面,Ling-1T 是已知规模…- 0
- 0
开源AI
❯
个人中心
购物车
优惠劵
今日签到
有新私信
私信列表
搜索
扫码打开当前页
返回顶部
幸运之星正在降临...
点击领取今天的签到奖励!
恭喜!您今天获得了{{mission.data.mission.credit}}积分
我的优惠劵
-
✈优惠劵使用时效:无法使用使用时效:
之前
使用时效:永久有效优惠劵ID:×
没有优惠劵可用!







