全部标签

agent

张鹏对谈李广密：Agent 的真问题与真机会，究竟藏在哪里？

本文是一篇关于 AI Agent 的深度对谈，邀请拾象科技创始人李广密和 AI Research Lead 钟凯祺，共同剖析 Agent 热潮下的真问题与真机会。讨论覆盖 Agent 的产品形态（通用与垂直、Model as Agent）、务实成长路径（从 Copilot 到 Agent，以 Cursor 为例）、Coding 作为通往 AGI 关键试炼场的逻辑、评估好 Agent 的标准（数据飞…
AI 前线
- 0
- 0
勇敢牛牛1月3日
最权威 AI Agent 避坑指南来了！智能体越多死得越快，效率最高暴跌 70%

文章围绕 Google DeepMind 和 Google Research 的重磅论文《迈向 Agent 系统的扩展科学》展开，驳斥了“Agent 越多越好”的误区。通过对多种 Agent 架构的实验分析，得出了三个关键发现：任务越复杂 Agent 越多死得越快，3-4 个 Agent 是“黄金分割点”；Agent 存在边际收益递减，当单个 Agent 足够聪明时组团反而是负收益；多 Agent…
AI 前线
- 0
- 0
勇敢牛牛1月3日
吴恩达 Agentic AI 新课：手把手教你搭建 Agent 工作流，GPT-3.5 反杀 GPT-4 就顺手的事

文章详细介绍了吴恩达最新推出的 Agentic AI 课程，强调其核心在于将 Agentic 工作流开发沉淀为反思、工具、规划和协作四大设计模式。课程不仅教授如何让大模型像人类一样拆解复杂任务、反思结果、利用工具修正偏差，更首次强调评估与误差分析在智能体开发中的决定性作用。通过“分解-执行-评估-优化”的循环迭代，Agentic AI 能显著提升性能，甚至让 GPT-3.5 在特定编程任务中超越 …
AI 前线
- 0
- 0
勇敢牛牛1月3日
AI Agent 的「GPT 时刻」，Manus 炸醒整个 AI 圈！

文章介绍了 Monica.im 研发的全球首款 AI Agent 产品 Manus。Manus 强调直接交付最终结果的能力，通过模拟人类工作方式的多代理架构，在独立虚拟机中运行，可调用各类工具完成复杂任务。文章列举了 Manus 在旅行规划、股票分析、教育内容创建、保险政策比较以及 B2B 领域的应用案例，展示了其自主规划和执行任务的能力。Manus 像一个数字代理人或实习生，能根据用户需求进行自…
AI 前线
- 0
- 0
勇敢牛牛1月3日
当 AI 创业公司遇困境，能借“Agent 化”找到新出路吗？

文章探讨了 AI Agent 技术的发展现状和未来趋势。2023 年底斯坦福大学的 AI 实验项目引发了对 AI Agent 的期待，但一年后，许多产品仍停留在对话机器人阶段。2024 年，AI Agent 成为科技巨头竞争的新焦点，OpenAI、Anthropic、微软、谷歌等公司纷纷推出相关产品，国内大厂如百度、阿里、腾讯也积极布局。尽管 AI Agent 依赖 LLM 的“黑盒”特性，存在不…
AI 前线
- 0
- 0
勇敢牛牛1月3日
从第一性原理深度拆解 Claude Agent Skill

文章对 Claude Agent `Skills` 系统进行了深度解构，阐明其并非传统可执行代码，而是通过提示词扩展和上下文修改来增强大语言模型（LLM）能力的“元工具”架构。它详细阐述了`Skills`的生命周期，从文件解析、API 请求结构到 Claude 的决策过程，强调其决策完全基于 LLM 的自然语言理解，而非算法式的技能选择器。文章深入介绍了`SKILL.md`的构成（Frontmat…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
Agent 框架思考指南

本文分析了 Agent 框架，强调了在构建可靠的 Agent 系统中上下文控制的重要性。文章指出，Agent 系统由工作流和 Agent 组成，大多数框架都是 Agent 抽象。Agent 抽象简化了入门，但可能导致 LLM 上下文不够清晰。文章介绍了 LangGraph 作为一个支持高级抽象和低级功能的编排框架，兼顾了易用性与灵活性。文章还讨论了 Agent 框架的各个维度，包括工作流与 Age…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
Manus 创始人手把手拆解：如何系统性打造 AI Agent 的上下文工程？

文章由 Manus 联合创始人兼首席科学家 Peak 撰写，深入剖析了构建高性能 AI Agent 的上下文工程核心实践。作者首先解释了选择上下文工程而非从头训练模型的原因，强调其迭代速度快且能保持与底层模型正交性。随后，文章详细介绍了六个关键实践：首先，围绕 KV-Cache 设计以优化延迟和成本，通过保持提示前缀稳定、追加式上下文和明确标记缓存断点。其次，通过掩码而非移除的方式约束行为选择，避…
AI 前线
- 0
- 0
勇敢牛牛25年12月31日
独家对话 OpenAI 姚顺雨：生成新世界的系统

文章独家对话 OpenAI 研究员姚顺雨，深入探讨 AI Agent（智能体）的演进历程与未来趋势。姚顺雨从个人经历出发，阐述了其从计算机视觉转向语言模型，并最终专注于 Language Agent 研究的非共识路径。他强调语言作为实现泛化通用系统最本质的工具，并指出 GPT 模型在开放行为空间决策上的优势远超 BERT。文章详细梳理了 Agent 从符号主义 AI 到深度强化学习，再到大语言模型…
AI 前线
- 0
- 0
勇敢牛牛25年12月30日
AI 编码不是梦：手把手教你指挥 Agent 开发需求

本文深入探讨了 AI Agent 在后端开发实践中的应用，旨在通过可复刻的操作流程，指导开发者指挥 AI 完成编码任务。文章首先介绍了 AI 编码的准备工作，包括技术方案、工程结构和内部 AI 软件的使用（文中实践由其他内部 AI 软件进行，通义灵码等可作为替代工具）。核心内容围绕“分层拆解”展开，详细演示了如何利用 Prompt Rule 和 Agent 能力，逐步生成工程目录结构、应用层接口定…
AI 前线
- 0
- 0
拼凑梦境25年12月30日
信息量很大！2025.10.2 硅谷内部关于 AI Agent 的讨论会实录

本文深度总结了硅谷一次关于 AI Agent 在生产环境中成功部署的关键因素的行业讨论会。会议指出，高达 95%的 AI Agent 部署失败并非模型智能不足，而是由于上下文工程、安全性、记忆设计等支撑体系的缺失。文章详细探讨了高级上下文工程的重要性，包括 LLM 特征选择、语义与元数据分层，以及处理 Text-to-SQL 挑战的方法。同时，强调了治理与信任在 Agent 落地中的核心地位，如溯…
AI 前线
- 0
- 0
泪满春衫袖25年12月28日
张涛首次回应争议，Manus 为什么没有被替代？｜清华校园行

文章记录了真格基金管理合伙人戴雨森与 Manus 联合创始人张涛在清华大学的深度对谈。张涛首次系统回应了围绕 Manus 的技术含量和营销方面的质疑。他详细阐述了 Manus 如何通过“Less structure， more intelligence”及“Zero Predefined Workflow”的核心技术理念，将任务决策能力完全交还给模型，使其在 Agent 基准测试中长期保持领先。他…
AI 前线
- 0
- 0
泪满春衫袖25年12月28日
【生成式人工智慧與機器學習導論 2025】第 2 講：上下文工程 (Context Engineering) — AI Agent 背後的關鍵技術

文章详细阐述了上下文工程（Context Engineering）这一概念，并将其与传统 Prompt Engineering 进行了对比，指出上下文工程更侧重于自动化和全面的输入管理。它强调语言模型本质是文本接龙，要获得理想输出，除了模型训练，优化输入（即上下文）至关重要。文章详细拆解了一个完整上下文的七大组成部分，包括用户 Prompt、系统 Prompt、对话历史、长期记忆、外部资料源（RA…
AI 前线
- 0
- 0
偷掉你的影子25年12月28日
Agent Skills 技术协议与开源实现，让大模型拥有“即插即用”技能

文章深入探讨了 Anthropic 近期发布的“Agent Skills”技术协议，旨在解决大模型在执行复杂任务时对领域专业知识模块化、可扩展注入的需求。该协议通过一套结构化的指令、脚本和资源文件夹，使得智能体能够动态发现并加载这些内容，从而在特定任务上表现更优。文章详细阐述了 Agent Skills 的架构，包括其文件夹结构、SKILL.md 文件格式，以及如何绑定附加内容和管理技能上下文。M…
AI 前线
- 3
- 0
勇敢牛牛25年12月27日
2025 AI 现场：我们这一年的目击与狂想

本期《十字路口》播客与嘉宾庄明浩共同复盘 2025 年的 AI 与科技行业，将其定义为“拐点之年”，深入探讨了技术、产品、资本可能触及的极限。对话首先分析了大模型战场，从 DeepSeek R1 的低成本撬动效应，到 Sam Altman 对 AGI“轻轻迈过”的重新定义，以及中美在技术路线和开源策略上的分野。接着，深入探讨了多模态技术（如 Sora 2、世界模型）的激烈竞争和清晰的商业化路径，并…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
深度｜Meta 首席科学家 LeCun：Meta 正研究新一代 Agentic 系统，能够理解物理世界并规划行动实现目标

Meta 首席科学家 Yann LeCun 在本文中详细介绍了 Meta 正在研究的新一代 Agentic 系统，该系统旨在通过观察和行动来理解物理世界，并规划行动以实现目标。LeCun 强调了当前大语言模型（如 GPT）的性能已接近天花板，未来的 AI 系统将需要新的架构和方法，超越简单的文本预测。他还讨论了开源 AI 平台的重要性，认为开源能够促进技术进步和全球协作，同时反对过度监管 AI 研…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
除了 MCP 我们还有什么？

本文深入探讨了 agents.json 规范，该规范构建于 OpenAPI 标准之上，旨在优化 AI agent 与互联网服务提供商的交互，解决传统 API 与 LLM 适配的困难以及多步骤调用可靠性问题。文章对比了 agents.json 与 MCP 以及谷歌 A2A agent.json 的异同，强调了 agents.json 专注于 API 交互，并详细解释了 agents.json 的工作…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
Harvey：ARR 1 亿美元、估值 30 亿，用 Agent 思路解决法律场景 AI 落地难题

Harvey 成立于 2022 年，ARR 预计今年将达到 1 亿美元，公司估值达到 30 亿美元。Harvey 通过与顶级律师事务所合作，深入理解法律行业的复杂需求，构建了基于 Agentic workflow 的智能协作系统，提供垂直场景的解决方案。Harvey 的核心竞争力在于其 “引用能力”，能够确保 AI 生成内容的精确性和可追溯性，并通过 “不接触” 原则保护客户数据隐私，赢得了客户的…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
OWL 团队万字分享：复现 Manus 最好的团队，如何看待 Agentic AI 的落地现状？

文章是 CAMEL-AI 创始人李国豪对 Agentic AI 落地现状的万字分享，讨论了 OWL 项目与 Manus 的区别，Agent 技术浪潮的推动因素，并深入探讨了 MCP 的应用前景。文章还分析了垂直领域 Agent 的发展方向，强调了在特定领域深入研究和解决核心痛点的重要性。此外，还讨论了 Agent 产品与普通 AI 工具在人机交互方面的差异，以及 Agent 系统在 AI for …
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
从 RAG 到 Context：2025 年 RAG 技术年终总结

文章对 2025 年 RAG 技术的发展进行了年终总结，指出尽管面临长上下文和 Agent 分流的质疑，RAG 仍在企业级 AI 落地中展现出不可替代的数据基础设施地位。文章详细探讨了 RAG 的技术改进，包括将检索解耦为“搜索”与“检索”两阶段、TreeRAG 与 GraphRAG 的融合，以应对传统 RAG 在处理复杂查询时的痛点。文章强调了 RAG 从知识库向通用 Agent 数据基座演进的…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
智谱发布首个具备深度研究和操作能力的 AI Agent

智谱发布了 AutoGLM 沉思，这是一款具备深度研究和实际操作能力的 AI Agent。例如，AutoGLM 沉思能够模拟人类在面对复杂问题时的推理与决策过程，像人一样获取并理解环境信息，调用和操作工具完成复杂任务，推动 AI Agent 从单纯的思考者进化为能交付结果的智能执行者。该智能体融合了 GLM-4 的通用能力、GLM-Z1 的反思能力、GLM-Z1-Rumination 的沉思能力以…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
从代码生成到自主决策：打造一个 Coding 驱动的“自我编程”Agent

文章深入探讨了阿里云团队如何从传统的 JSON 调用模式进化，构建一个“代码驱动”的 AI Agent，使其能够通过生成和执行 Python 代码来实现自主决策和复杂任务处理。该 Agent 基于 ReAct 模式深度优化，引入 Py4j 实现 Java 与 Python 间的泛化调用，并采用 Spring Boot 构建后端。其核心创新在于 Agent 能够“自我编程”，不仅调用外部工具，还能利…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
微软正式开源 UFO²，Windows 桌面迈入「AgentOS 时代」｜机器之心

微软正式开源了业内首个深度集成 Windows 操作系统的桌面智能体平台 UFO² AgentOS。该平台通过多智能体架构，实现了任务的精准分解与灵活执行。UFO² 在统一 GUI-API 混合执行、混合控件感知、持续增强的动态知识集成、高效的推测式多步执行和无干扰的 PiP 虚拟桌面执行环境等核心维度实现了突破。实验结果表明，UFO² 在超过 20 款主流 Windows 应用中进行了充分验证，…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日
张小珺对谈李广密：Q1 AGI 热点回顾，非共识下什么才是 AGI 的主线？

文章是张小珺与李广密的对话，深入探讨了 2025 年 Q1 中美 AI 领域的热点问题，核心聚焦于 AGI 的路线图。李广密强调了 Pre-training 的重要性，认为它是模型能力涌现的关键，并对 OpenAI 的战略选择和组织问题进行了分析。他还提出 Coding 是实现 AGI 的最佳环境，Agentic AI 是更关键的未来，Agent 落地有 Long Context reasonin…
AI 前线
- 0
- 0
勇敢牛牛25年12月24日