千亿美元人工智能革命:规模超越工业革命




内容概要

在这场演讲中,红杉资本 (Sequoia Capital) 的 Konstantine Buhler 分享了关于人工智能 (AI) 的投资论点,并阐述了为何我们相信这一变革将带来一个价值 10 万亿美元的巨大机遇。演讲涵盖了当前的投资趋势与未来的投资主题,强调了行业正从追求确定性转向利用杠杆,从学术基准转向真实世界验证,并将算力 (compute) 视为新的生产函数。


目录

  • 引言:认知革命

  • 为何 AI 是工业革命 2.0

  • 价值 10 万亿美元的服务业机遇

  • 投资趋势一:杠杆优于确定性

  • 投资趋势二:真实世界的验证

  • 投资趋势三:强化学习

  • 投资趋势四:物理世界中的 AI

  • 投资趋势五:作为生产函数的算力

  • 投资主题一:持久记忆

  • 投资主题二:通信协议

  • 投资主题三:AI 语音

  • 投资主题四:AI 安全

  • 投资主题五:开源 AI

  • 结论:压缩演进的时间线


引言:认知革命

在红杉,我们坚信人工智能 (AI) 革命的到来,并认为这将是一场与工业革命同等重要,甚至更为宏大的变革。

在这次简短的演讲中,我们将分享这场认知革命 (cognitive revolution) 的核心内容,以及为什么它能提供一个价值 10 万亿美元的机遇。演讲分为四个部分:首先是我们在人工智能领域的投资论点;其次是商业机会;接着,我们会探讨一些我们观察到的当前 AI 发展中的投资趋势;最后,我们将展望未来 12 到 18 个月值得关注的投资主题。


为何 AI 是工业革命 2.0

我们认为,人工智能堪比工业革命。我们可以特别回顾工业革命中的三个关键节点:首先是蒸汽机的发明,它拉开了整个革命的序幕;其次是第一个工厂体系的建立,它将所有必要的生产要素集中在同一屋檐下;最后是我们今天所熟知的工厂流水线的诞生。

有趣的是这些节点之间的时间间隔:从第一台蒸汽机到第一家工厂,耗时 67 年,而且那家工厂甚至没有使用蒸汽机,而是以水力驱动。从第一家工厂到我们熟知的流水线,又过去了 144 年。

问题是,为什么花费了这么长时间?尤其是在这 144 年里发生了什么?我们认为,其根本原因在于“专业化”的必然要求 (specialization imperative)。一个复杂系统在发展到一定规模后,必须将通用组件和劳动力与高度专业化的组件和劳动力相结合,才能走向成熟。换言之,当时正在发生的事情,就是将通用技术进行专业化改造,以生产特定的产品。

现在,我们正处在认知革命中。可以说,1999 年的 GeForce 256 显卡就是这个时代的“蒸汽机”,而 2016 年则诞生了第一个“AI 工厂”,汇集了生成 AI 所需的所有要素。

那么问题来了,谁将成为这场认知革命中的洛克菲勒、卡内基、威斯汀豪斯和韦奇伍德?我们相信,正是今天的初创企业在践行着这种专业化的使命,而那些尚未成立的公司,将在此基础上构建出未来的应用。


价值 10 万亿美元的服务业机遇

当然,我们是红杉资本 (Sequoia Capital),而不是红杉历史研究院,所以让我们来谈谈商业价值。您可能在我们的 AI Ascent 峰会上见过这张图。左边是一个价值 3500 亿美元的圆圈,代表了云计算转型初期的软件支出,其中那道细长的部分是价值 60 亿美元的软件即服务 (SaaS) 支出。

后来发生的事情是,SaaS 不仅在本地部署软件 (on-prem software) 市场中占据了更大份额,实际上还扩大了整个市场的规模,如今已增长到超过 6500 亿美元。我们相信,类似的情景将在人工智能领域重演,而且机遇会更加巨大。

这就是价值 10 万亿美元的美国服务业市场,而今天其中可能只有约 200 亿美元被 AI 自动化。我们面临的机遇,不仅在于在这个巨大的市场中提升 AI 的份额,更在于将整个市场做得更大。

您可能看过上一张幻灯片,但这一张是首次公开。这是红杉内部备忘录的一部分,按最右侧一栏对服务业岗位进行了排序。该栏的数值是该岗位的“雇员总数”与“年薪中位数”的乘积,数据来源于美国人口普查局。

您会发现,这些都是市场规模 (TAM) 极其庞大的领域,而且红杉已经在其中进行了投资。例如,在注册护士领域,我们投资了 Open Evidence 和 Freed;在软件开发者领域,我们投资了 Factory 和 Reflection;在法律领域,则投资了 Harvey、Crosby 和 Finch。

在红杉,我们非常注重市场规模,尤其是市场本身。我们的创始人唐·瓦伦丁 (Don Valentine) 总是强调市场的重要性。这张图表展示了标普 500 指数 (S&P 500) 的市值构成,您会注意到其中有几家巨头公司,最左边的是英伟达 (Nvidia),市值超过 4 万亿美元,百分比代表其一年内的股价表现。但这张图上没有凯易律师事务所 (Kirkland & Ellis),也没有贝克·蒂莉会计师事务所 (Baker Tilly),尽管这些公司的年收入都高达数十亿美元。

我们相信,认知革命提供了一个扩大市场版图的机会,未来这张图表上将会出现许多在服务领域由 AI 驱动的大型独立上市公司。


投资趋势一:杠杆优于确定性

接下来,我们谈谈在当下人工智能认知革命中观察到的五个投资趋势。首先是杠杆优于确定性 (leverage over uncertainty)。

我们注意到,工作的性质正在发生转变:过去我们对任务的杠杆作用很小,但对结果有 100% 的确定性;未来我们将对任务拥有超过 100% 的杠杆,但对结果的具体表现形式,确定性会大大降低。

例如,作为一名销售人员,您今天可能需要亲自管理一系列客户账户,逐一监控潜在的合作机会。但在 AI 代理 (AI agent) 的未来,您可以借助像 Rocks 这样的工具,部署数百个 AI 代理,每个客户都对应一个,由它们来跟踪进展、发现变化,并提示您何时应该重新接触客户以扩大合作关系。

当然,AI 代理的工作方式不会和您完全一样,它可能会遗漏某些信息或犯错,这时就需要人来介入修正。在这种模式下,我们看到了超过 100% 甚至 1000% 的杠杆,尽管结果的不确定性有所增加。这已经不再是传统意义上的工作方式了。


投资趋势二:真实世界的验证

其次,我们发现,衡量标准已经从学术界转向了真实世界。在人工智能历史的大部分时间里,我们都使用学术基准 (academic benchmarks) 来评估模型。十多年前,当我还是 AI 工程师时,我们用 ImageNet 作为计算机视觉研究的基准。

但今天,要想证明自己的卓越,你必须在真实世界中验证。以 Expo 公司为例,他们希望证明自己开发的 AI 是世界上最强的黑客。他们没有仅仅停留在学术基准测试上,而是走向了真实世界,在 HackerOne 平台上与全球所有注册黑客同台竞技,寻找系统漏洞。

最终,他们证明了在真实世界的数据上,他们不仅能够竞争,还能取胜,成为世界第一的黑客。我们认为,这已经成为新的黄金标准:重要的不仅仅是学术基准,更是真实世界的衡量结果。


投资趋势三:强化学习

第三个趋势是强化学习 (reinforcement learning)。AI 行业讨论强化学习已经很久了,而在过去一年,它终于登上了中心舞台。

不仅大型的推理实验室 (reasoning labs) 从中受益,我们投资的许多公司也同样获益匪浅。例如,Reflection 公司就利用强化学习来训练一些在编程领域最优秀的开源模型。


投资趋势四:物理世界中的 AI

第四个趋势是 AI 在物理世界中的应用正变得鲜活起来。这不仅限于人形机器人,还包括利用人工智能来创造新的流程和硬件。

以 Nominal 公司为例,他们利用 AI 加速硬件制造过程,并在硬件部署到现场后,同样利用 AI 进行质量保证。


投资趋势五:作为生产函数的算力

最后,我们注意到,新的生产函数是算力 (compute),即每位知识工作者对应的浮点运算次数 (FLOPs per knowledge worker)。我们对自己投资组合公司的调查显示,他们普遍预测,每位知识工作者对应的算力消耗至少将增加 10 倍。

这还只是保守估计。因为如前所述,一位知识工作者可能会同时使用一个、几十个、几百个甚至上千个 AI 代理。更乐观地看,我们预见未来这个数字可能会增加 1000 倍甚至 10000 倍。

这不仅对提供推理服务的公司意义重大,对那些保护推理过程安全的公司,以及利用这一新生产函数赋能更多工作者的公司来说,都蕴含着巨大的力量。


投资主题一:持久记忆

接下来,我们聊聊未来一年中我们重点投资的五个主题。第一个主题是持久记忆 (persistent memory)。

持久记忆至少包含两个层面:第一是长期记忆,即让 AI 能够长时间记住与之交互的上下文信息;第二是 AI 身份的持久性,即让 AI 代理在一段时间内保持自己独特的个性和风格。

要让 AI 深入更多的工作职能,攻克这一难题至关重要。一个应用于生产力领域的 AI,需要具备长期记忆,能够理解整个组织和特定职能的完整背景。

我们注意到,在持久记忆领域,尚未出现像模型参数扩展定律 (scaling laws) 那样清晰的规律。尽管有很多尝试,比如向量数据库 (vector DBs) 和检索增强生成 (RAG),以及不断加长的上下文窗口,但这个问题仍未被彻底解决,预示着巨大的未来机遇。


投资主题二:通信协议

下一个主题是无缝通信协议 (seamless communication protocols)。最近,多模态融合通信协议 (MCP) 引起了广泛关注,这是理所当然的。但让我们回想一下互联网革命,TCP/IP 协议并非终点,而是发令枪。

在当前的通信革命中,我们有机会让不同的 AI 实现无缝沟通。我们相信,这将催生出许多重要的应用。

以购物为例。现在,如果你想用 AI 购物,你可能会先用它做些研究,然后通过你常用的“一键下单”服务商完成购买。但在未来,得益于无缝通信协议,AI 将能够为你完成整个流程:它会自动比价、执行购买,并完成所有后续步骤,同时削弱那些因使用便捷而建立起护城河的公司的优势。


投资主题三:AI 语音

第三个主题是 AI 语音 (AI voice)。你可能会惊讶我没有提 AI 视频,这是故意的。我认为 AI 视频可能在一年后才会成熟,但 AI 语音的时代就在眼前。

这不仅是因为其保真度 (fidelity) 和音质已经提升到足以满足日常使用的水平,更重要的是延迟 (latency) 大大降低,使得与 AI 进行实时对话成为可能。

AI 语音的应用场景非常丰富,令人兴奋,包括 AI 朋友、AI 伴侣、AI 治疗师等面向消费者的应用 (B2C)。我个人也对 AI 语音在企业端的其他应用充满期待。

例如,在企业物流规划中,许多协调工作至今仍通过语音完成,未来可以利用 AI 语音实现自动化。同样,在金融领域,大宗固定收益产品的买卖也常通过电话与场外交易柜台 (OTC trading desk) 进行,AI 语音同样可以加速这一过程。


投资主题四:AI 安全

接下来是 AI 安全 (AI security)。我们认为这个领域存在着极其巨大的机会,它贯穿了从开发层到消费层的整个链条。

在开发层,有机会帮助大型基础模型实验室和 AI 实验室以安全的方式开发技术。在分发环节,需要确保模型以安全的方式分发,防止恶意行为者介入。

对于终端用户,需要确保他们在消费 AI 产品或编写新应用时,不会无意中引入漏洞。一个具体的例子是,一个普通消费者可能被其 AI 指示通过命令行终端 (Terminal) 下载一个软件。他可能不熟悉命令行,而 AI 也可能不知道这个软件会给他的设备环境带来安全风险。

我们将进入一个 AI 不仅保护个人用户,也保护 AI 代理自身的世界。事实上,我们预见,与物理世界不同,在数字世界里,我们可以为每个人甚至每个 AI 代理配备数百个 AI 安全代理。你不受物理空间或同等成本的限制,可以实现海量的安全代理部署。


投资主题五:开源 AI

最后,我们认为开源 (open source)正处于 AI 发展旅程中的一个关键时刻。如果在两年前问我们,我们会说开源似乎有机会与最先进的闭源基础模型竞争,甚至可能胜出。

但今天,这个前景看起来更加岌岌可危。我们坚信,开源社区必须参与竞争,并提供一些最顶尖的基础模型,这至关重要。

我们认为,这对于一个更自由、更开放、人人皆可创造的未来是不可或缺的。我们希望能参与构建这样一个未来:让每个人都能使用优秀的开源模型来创造出色的产品,让 AI 的未来不只局限于资金极其雄厚的科技巨头。


结论:压缩演进的时间线

以上是我们正在思考的五个投资主题。现在的问题是,如果我们能够将这些主题转化为实际进展,会发生什么?

我们相信,这些进展将能够把通往“认知流水线”的漫长道路,从数十年大幅压缩至短短几年。非常感谢您的聆听,期待与您一同参与这场认知革命的建设。


AI 前线

AI 安全危机迫在眉睫(及应对之策)| 桑德·舒尔霍夫

2025-12-23 22:49:19

AI 前线

API 中的 gpt-realtime 模型介绍

2025-12-23 22:49:24

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索