全部标签

开源AI

吴恩达发布全开源桌面AI同事OpenWorker：可本地运行、模型自由切换、关键操作全程人类把关

吴恩达发布开源桌面AI代理OpenWorker，支持多模型自由切换与本地化部署，强调隐私安全与人类最终决策权。它在执行消息发送、日历修改、文件写入等关键操作前强制暂停并请求确认，实现AI从‘响应式助手’向‘可信赖工作伙伴’的范式升级。
AI 前线
- 0
- 0
探索X7月26日
DeepSeek-R1 发布，性能对标 OpenAI o1 正式版

DeepSeek 正式发布了 DeepSeek-R1 模型，该模型在数学、代码、自然语言推理等任务上性能对标 OpenAI o1 正式版。DeepSeek-R1 在后训练阶段大规模使用了强化学习技术，极大提升了模型推理能力。DeepSeek 不仅开源了模型权重，还提供了 API 服务，允许用户通过设置 `model='deepseek-reasoner'` 调用思维链输出。此外…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
Qwen3-Coder：480B 参数的超强“代码特工”

文章详细介绍了通义大模型最新开源的 Qwen3-Coder，特别是其旗舰版本 Qwen3-Coder-480B-A35B-Instruct。该模型是拥有 480B 参数、35B 有效参数的 MoE（混合专家）模型，在代理式编程、浏览器智能操作和基础编码任务上均达到开源模型 SOTA。文章深入阐述了模型在预训练阶段的数据扩展（7.5T 高质量代码）、上下文扩展（原生 256K，最高 1M）以及合成数…
技术落地
- 0
- 0
勇敢牛牛25年12月30日
50+ Claude 技能库闪现 GitHub，教你的 AI 学会9大领域专业活儿

随着 AI 从“对话”向“协作执行”转型，Anthropic 的技术生态迎来重要里程碑。近日，一套全面的 “Claude 技能”（Claude Skills）库已在 GitHub 正式开源发布。这标志着 Claude 不再仅仅是一个回答问题的助手，而是一个拥有标准化、可定制工作流的专业执行器。50+ 技能矩阵:覆盖从文档到安全的全场景这套技能集包含9大类别、50多项专业技能，旨在教导 Claud…
AI 前线
- 0
- 0
探索X25年12月29日
深度｜Meta 首席科学家 LeCun：Meta 正研究新一代 Agentic 系统，能够理解物理世界并规划行动实现目标

Meta 首席科学家 Yann LeCun 在本文中详细介绍了 Meta 正在研究的新一代 Agentic 系统，该系统旨在通过观察和行动来理解物理世界，并规划行动以实现目标。LeCun 强调了当前大语言模型（如 GPT）的性能已接近天花板，未来的 AI 系统将需要新的架构和方法，超越简单的文本预测。他还讨论了开源 AI 平台的重要性，认为开源能够促进技术进步和全球协作，同时反对过度监管 AI 研…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
Meta 深夜开源 Llama 4！首次采用 MoE，惊人千万 token 上下文，竞技场超越 DeepSeek

Meta 发布了最新的 Llama 4 系列 AI 模型，包括 Llama 4 Scout、Llama 4 Maverick 和 Llama 4 Behemoth。这些模型采用混合专家 (MoE) 架构，显著提升训练和推理效率，具备多模态能力，支持多种语言，并在多个基准测试中表现出色。Llama 4 Scout 拥有 170 亿激活参数和 10M token 超长上下文窗口，为业界领先，解锁了围绕…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
阿里深夜开源 Qwen2.5-VL 新版本，视觉推理通杀，32B 比 72B 更聪明

阿里通义千问团队开源了 Qwen2.5-VL-32B-Instruct 多模态模型，该模型在回复人类偏好、数学推理和图像细粒度理解与推理方面进行了改进，尤其适用于 AI Agent 部署。通过与 Mistral-Small-3.1-24B、Gemma-3-27B-IT 等模型的对比，Qwen2.5-VL-32B-Instruct 在 MMMU、MMMU-Pro 和 MathVista 等多模态任务…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
DeepSeek 绝不仅仅是开源的胜利

文章深入分析了 DeepSeek 爆火的原因，指出其成功并非仅因模型性能媲美 OpenAI 或成本更低，更重要的是其开源策略加速了 AI 技术的普及。文章探讨了开源与闭源模式在大语言模型领域的差异，强调了开源在降低推理成本、提升开发者灵活性和促进社区贡献方面的价值。DeepSeek 的技术创新，如混合质量模型 Moe、多头潜在注意力机制 MLA 等，降低了对硬件的需求，影响了 AI 基础设施。文章…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
达摩院开源 VideoLLaMA3：仅 7B 大小，视频理解拿下 SOTA | 在线可玩

本文介绍了达摩院开源的 VideoLLaMA3，这是一个以图像为中心构建的新一代多模态视频 - 语言模型。该模型仅有 7B 大小，在通用视频理解、时间推理和长视频理解三个核心维度评估中表现优异。同时，适用于端侧的 2B 版本在图像理解上也表现出色，在 InfoVQA 和 MathVista 等基准测试中取得领先。文章详细阐述了 VideoLLaMA3 以图像为中心的训练范式，包括视觉编码器适配、视…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
DeepSeek-V3 深夜惊爆上新！代码数学飙升剑指 GPT-5，一台 Mac 可跑

文章报道了 DeepSeek V3 最新版本 DeepSeek-V3-0324 的发布及其性能提升。该模型在代码和数学推理能力上均有显著提升，甚至在代码方面可以与 Claude 3.7 相媲美。尤其在前端开发等特定任务中，DeepSeek V3 展现出超越其他模型的潜力。此外，DeepSeek V3 采用 MIT 开源协议，允许自由修改和商业应用。该模型可在消费级设备上运行，如苹果 M3 Ultr…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
准确率 92.7%逼近 Claude 3.5、成本降低 86%，开源代码定位新神器 LocAgent 来了｜机器之心

本文详细介绍了由 OpenHands 等机构提出的 LocAgent 框架，一个专用于大规模代码库代码定位的图索引 LLM Agent。针对自然语言问题描述与实际代码位置间的语义和结构差异难题，LocAgent 通过将代码库构建为包含丰富依赖关系的异构图，并提供 SearchEntity、RetrieveEntity、TraverseGraph 等工具接口供 LLM Agent 调用。Agent …
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
开源版 Operator 原生 AI 智能体来了？字节跳动开源 UI-TARS 模型

文章介绍了字节跳动开源的原生 GUI 智能体模型 UI-TARS，旨在解决通用大模型在图形用户界面交互中存在的精度、理解和效率问题。UI-TARS 模型具有四大创新点：GUI 增强感知、统一动作建模、System 2 推理和迭代式反思训练，并采用端到端智能体模型范式。通过与 OpenAI 的 Operator 和 Claude 等模型在 OSWorld 和 AndroidWorld 等基准测试上的…
AI 前线
- 2
- 0
勇敢牛牛25年12月23日
Ling-1T，智渊、思简

文章详细介绍了 Ling Team 推出的 Ling-1T 大模型，这是一款基于 Ling 2.0 架构的万亿参数开源旗舰非思考模型。该模型在复杂推理、代码生成、前端开发和跨领域泛化等任务上均达到 SOTA 水平，实现了高效推理与精准输出的平衡。Ling-1T 支持最高 128K 上下文窗口，通过“中训练+后训练”的演进式思维链（Evo-CoT）提升推理能力。在训练方面，Ling-1T 是已知规模…
AI 前线
- 0
- 0
勇敢牛牛25年12月23日