Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义

文章回顾了“AI 助手”概念从 Siri、ChatGPT 到 Agent 的三次演变,指出当前市场对能“做”事的 AI 助手的强烈需求。文章详细介绍了 Manus 作为 Agent 启蒙者的角色及其成功之处,但也分析了它受限于底层模型和成本的局限性。同时,文章提出了第三方 Agent 创业者转向基于独有知识库的垂直深度 Agent 的新方向。接着,文章探讨了 Agent 从“炫技”到“日常”的“iPhone 时刻”,并以 Kimi 在国内市场的实践为例,阐述了原生 Agent 能力、长时任务处理和闭环数据飞轮是未来第三代 AI 助手的核心条件。最后,文章强调了基座模型厂商在 Agent 竞赛中的主导地位,并展望了 Agent 真正融入日常工作流的未来。




2026-01-14 18:07 广东

Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义

Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义

Siri → ChatGPT → ???

Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义

回顾过去十几年,市场对“AI助手的想象经历过三次大规模的预期校准。

第一次是 Siri 诞生时,语音控制带来了交互的新鲜感,人们以为电影里的智能管家 Jarvis 就在眼前,但随后发现它更多时候只是一个语音闹钟;

第二次是 ChatGPT 横空出世,流畅的对话与推理能力让人觉得 AI 终于有了脑子,但很快市场意识到,它依然只是一个在对话框里坐而论道的智者,看不到对话框之外的世界。

2025 年初,Manus 的出现,让 Agent 的概念有了实感。这一次的冲击不同以往——很多人第一次看到 AI 不仅在,而且在。它当着你的面打开浏览器、编写代码、调试错误、甚至因为网页加载太慢而主动刷新。

 Manus 的热度随着被收购而逐渐平息,人们才发现,无论技术外壳如何变迁,人类对 AI助手的核心渴望从未改变:用户不只想要一个仅仅能听懂话的陪聊,也不只想要一个会在黑底白字界面里写代码的极客工具;大家想要的,一直都是一个更聪明、真正能把活儿干完的帮手。

随着 Manus 完成它的历史使命,Agent 的下半场大幕正在拉开。

图片

01

Manus 
完成了它的历史使命:Agent 的启蒙运动

作为一家公司,Manus 的最终归宿或许存在争议;但作为一个产品现象,Manus 已经完成了它的历史使命——它是 Agent 时代的启蒙者。

 Manus 之前,Agent 更多停留在学术论文和极客的 Python 脚本里。Manus 的成功之处在于,它通过可视化的交互,第一次向普通用户展示了 Claude 模型背后潜藏的 Agent 能力。它把拆解任务-自主执行-环境反馈-修正路径这一整套复杂的黑盒逻辑,变成了一个让用户盯着屏幕看的直观过程。

Manus  Claude 模型是典型的互相成就Claude 稳定的计算机使用(Computer Use)能力、代码能力、工具调用能力是地基,而 Manus 是那座拔地而起的样板房。Manus 的流行,本质上是 Anthropic 技术愿景在应用层的一次成功落地。

然而,Anthropic 自家产品 Claude Code 的持续破圈,影响力逐渐从技术圈外溢,也揭示了一个道理:Agent 的天花板,依然由底层大模型决定。

当应用层的交互红利被吃透后,竞争会回归到模型本身。Manus 展示了过程,但受限于模型对虚拟环境的适配度、API 成本和推理稳定性,它依然难以成为大家日常工作的依赖。与此同时,国内外的其他基模创业公司——无论是 OpenAI 还是国内的DeepSeekKimi——都已将Agent作为发力方向:通过把 Agent 能力直接内化进模型里。

但这并不意味着第三方 Agent 创业者的末日,一个更有价值的方向已经浮出水面:基于独有知识库的深度Agent当通用执行力被第一方产品内化成模型能力时,第三方 Agent 的核心竞争力就从执行力转向了信息不对称

最典型的例子是金融研报 Agent。一个能够调取过去二十年、数百万份非公开独家研报数据库,并能根据这些高价值信息进行分析的 Agent,其价值远超一个只能翻翻网页的通用工具。在法律、医疗、审计等垂直领域,这种基于孤岛数据构建的 Agent 产品,才是第三方厂商真正能守住的护城河。

现在,行业正处于一个微妙的瓶颈期:基模的 Agent 能力在飞速提升,不同的基模厂商会有各自希望重点突出的 Agent 能力侧重点,但在产品形态上,大多数厂商还在摸索,试图找到让这些能力真正渗透进普通人日常工作流的路径。

图片

02

A
gent “iPhone时刻:从炫技到日常

所有现在的 AI 助手,终将进化为 Agent。这已是行业共识。

如果说 2025 年是 Agent 功能机时代”——大家还在比拼谁能多轮联网搜索、谁调用的工具多;那么 2026 年,行业正在呼唤 Agent “iPhone 时刻这场战争的决胜点在于两端:一端是模型原生 Agent 能力的硬核比拼,另一端是产品设计的范式革命。

在国内的赛场上,这种角逐尤为激烈。

最早嗅到这一气息并拿到入场券的,是 Kimi判断一个产品是否切中刚需,有一个极具中国特色的指标——“闲鱼认证。在 Kimi 256月上线深度研究功能,由于免费用户能使用的次数有限,闲鱼上出现了大量倒卖付费会员次数和代跑服务的现象。这种求而不得,验证了用户对于“AI 帮我做完一件事的真实渴望。

Manus 走了,原生 Agent 登场:“AI 助手”的第三次重新定义

随后的故事不仅发生在应用层。Kimi 推出的 K2 模型,是国内较早旗帜鲜明主打 Agentic 能力的基座模型。这直接催生了 Kimi 的通用 Agent 模式。与传统的聊天框不同,Kimi  Agent 模式更像是想要打造一个全栈能力的虚拟工作环境。通过 Agent 模式,Kimi 尝试打破对话的边界:从处理百万行 Excel 数据到生成复杂的 PPT,它不再是聊完即走,而是像人类一样,从列计划、做调研开始,一步一步去完成一个项目。

2025 年双 11 期间,随着 Kimi 编程套餐的上线,他们也推出了 Kimi CLI 工具。这是一款在命令行里运行的 Agent,与 Anthropic  Claude Code 类似,专门服务于开发者的代码场景,但也开始外溢到非技术人员的非编码工作场景。

与此同时,国内战局并未大定。DeepSeek 新模型主打的重点是 Agent 能力。智谱选择了一条差异化的路径,他们开源了 Phone Use 模型。这个模型更侧重于通过视觉识别,像人手一样去操作现有的手机App 界面……

图片

03

聊天时代结束,中国的Anthropic竞赛开始

ChatGPT 开启的 Chat 时代也正在落幕。

未来的 AI 助手,衡量标准将变得非常务实:能不能帮我定位这个线上 Bug,自行搜索解决方案,写好修复代码,跑通测试,并把补丁推上线?能不能帮我整理完这 200 份财报并画出图表?能不能帮我把本周 5 场产品评审会的录音听完,整理出所有需求变更点,同步更新到 PRD 文档,并自动在项目管理软件里创建好对应的开发任务?

在这场从的转型中,Anthropic 提供了一个参考样本。从早期的 Claude Code 到最近刚刚上线、面向大众协作的 Cowork,尽管 Cowork 作为一个新产品,其实际体验和用户口碑还有待时间验证,但它所代表的方向是清晰的:最强大的 Agent,一定来自基模厂商。

在中国,谁能成为那个中国的 Anthropic”

答案不在于谁的模型跑分更高,而在于谁能最先做出第三代 AI 助手。这个助手需要满足三个严苛的条件:

第一、它必须具备原生的 Agent 能力,而不是靠外部提示词工程堆砌出来的伪智能; 

第二、它必须能处理长时任务(Long-horizon tasks),能像人类员工一样,为了一个目标连续工作数小时甚至数天,而不是聊几句就断片

第三、它必须拥有闭环的数据飞轮,让每一次任务执行的成败,都能成为模型进化的养料。

在这个维度上,国内的模型创业者们正在加速。行业看到,DeepSeek 选择了能把Agent推理价格持续降下去的底层方案做突破,暂时没有在产品层发力;而 Kimi 依托自己的K2系列模型Agent 能力,在深度研究”“PPT””数据分析等生产力场景上有了忠实用户群,也初步验证了他们的会员付费能力。智谱则通过开源AutoGLM模型,想让会操作手机的Agent给每个人日常生活带来帮助。

对于用户而言,谁是中国的 Anthropic”并不重要。重要的是,当那个对话框消失,取而代之的是一个真正能独立思考、并在后台默默把活儿干完的帮手时,市场才算真正迎来了 Agent 的时代。

毕竟,最好的 AI,不是让你惊叹技术有多强,而是能让你觉得自己有多强。

//

推荐阅读

图片

未经「AI科技评论」授权,严禁以任何方式在网页、论坛、社区进行转载!

公众号转载请先在「AI科技评论」后台留言取得授权,转载时需标注来源并插入本公众号名片。

阅读原文

跳转微信打开


AI 前线

今日开源(2026-1-14):智谱×华为开源 GLM-Image!混合架构强化精确语义理解,文本渲染+复杂信息表达表现优异

2026-1-14 23:02:36

AI 前线

上科大何旭明团队新作:克服简单样本偏置,让多模态模型学会「难题优先」

2026-1-14 23:02:50

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索