内容概要
Vercel 的 CEO Guillermo Rauch 探讨了人工智能 (AI) 如何变革软件开发,特别是通过他们的文本到应用生成器 V0。他解释了 V0 如何通过关注可靠性和质量吸引了数百万用户,ChatGPT 如何成为一个关键的客户获取渠道,以及 AI 如何在各种业务职能中实现“虚拟同事” (virtual coworkers)。Rauch 分享了他对生成式网络 (generative web) 的愿景,认为未来的网络将由临时的、按需生成的应用组成,并预测网络将在未来几年内经历重大转型。
目录
-
序言
-
AI 对前端开发的影响
-
V0:革新原型设计与开发
-
AI 工具中的质量与开发者体验
-
Vercel 的历程与愿景
-
AI 在客户支持和业务转型中的作用
-
AI 驱动的基础设施的未来
-
AI 在搜索和内容创作中的应用
-
在 AI 竞争格局中航行
-
虚拟同事与专家代理的崛起
-
同步代理与异步代理
-
开发者工具和平台的演变
-
确保 AI 生成代码的安全与性能
-
向生成式和临时应用的转变
-
快问快答
序言
Guillermo Rauch: 现在我们有了一个非常强大的工具,能以一种极具扩展性的方式提供指导,这真的很好。过去,我们谈论的开发者世界可能只有几百万到上千万。现在,我们可以将这种指导和方向传递给更广泛的人群。
我认为,对于今天开始学习构建软件的人来说,这是一个激动人心的时刻,因为在某种程度上,你们正在跨越前一代人。前一代人通过他们的经验和艰苦的教训,学会了如何构建这些界面,但今天进入软件领域的人们,却能够接触到我们所有人集体学到的知识,这非常令人兴奋。
Sonya Huang: 今天,我们与 Vercel 的 CEO Guillermo Rauch 对话,探讨 AI 如何重塑软件开发。Guillermo 分享了构建 V0 的见解——Vercel 的文本到应用生成器,它不仅吸引了开发者,还吸引了设计师和市场营销人员,基本上是任何能够描述自己想构建什么的人。
Guillermo 预测,我们正在走向一个生成式网络 (generative web),应用程序将为个人用户按需创建,这可能使传统的可下载软件过时。他还揭示了 ChatGPT 如何意外地成为 Vercel 增长最快的客户获取渠道之一,让我们得以一窥 AI 已经如何改变商业基本面。
希望你喜欢这期节目。Guillermo,非常感谢你今天加入我们。
Guillermo Rauch: 很高兴来到这里。
AI 对前端开发的影响
Pat Grady: 我想直接进入正题。编码市场似乎正在经历天翻地覆的变化,而前端 Web 开发领域似乎是变化最快的部分。你看到了什么?你认为这个核心社区会发生什么变化?
Guillermo Rauch: 是的,似乎无论大型语言模型 (LLM) 擅长什么,人们都会对此感到非常兴奋。几年前,当 ChatGPT 问世时,我们在 Vercel 注意到的第一件事就是,ChatGPT 非常擅长编写 React 代码和 Tailwind 代码,这两种代码是当今大多数 Web 开发者使用的样式代码。
我们感到非常兴奋,因为我们看到 Vercel 一直致力于为人们提供工具和框架,使开发网站和在线发布变得非常容易。但这似乎是一种代际转变,转向比框架更好的东西。它不完全是一个像 Next.js 那样的 React 框架,你需要坐下来编写代码,它能让编写应用程序变得更容易。但在我看来,LLM 像是一次代际飞跃,比框架更通用,并且有可能向地球上的每一个人敞开大门,因为你只需要知道如何使用自然语言来生成代码。
这实际上激励了我们,而不是像通常那样选择忽略或恐惧它。我们真正地、深入地拥抱了它。我个人尤其如此,因为当时我正在使用 Copilot,它主要是在你的集成开发环境 (IDE) 中进行自动补全。
V0:革新原型设计与开发
Guillermo Rauch: 后来我意识到,这感觉就像是 AI 领域的下一个大事件,所以我们创建了 V0,一个文本到应用 (text-to-app) 或文本到前端 (text-to-frontend) 的工具。自那以后,几年过去了,它的增长速度惊人。我们从中学到了很多关于 AI 如何赋能下一代软件构建者的知识,而这些构建者可能不仅仅是开发者。
我认为这是市场上最大的不连续性或我们看到的最大变化。现在有一些 AI 编码工具正在吸引我称之为“开发者邻近” (dev adjacent) 的人群,比如设计师、市场营销人员,基本上是任何会用键盘的人。我有时开玩笑说,与其在团队聊天应用里闲聊,不如直接对 V0 “闲聊”,这样能创造更多价值。
Pat Grady: 这太棒了。当我们第一次对 GPT-3 及其可能带来的影响进行内部研究时,我记得我们构想的一个示例应用就是文本到前端的 Web 应用。看到 V0 如今全面发挥其力量,真是太疯狂了。前几天,我收到了一家公司的 B 轮融资演讲,他们的前端就是用 V0 构建的。
Guillermo Rauch: 很棒。关于种子轮融资就是这样,过去你筹集资金是为了创建你的第一个原型。从构思到将其转化为软件的成本相当高,所以你会通过种子轮融资来获得原型。而我最近听说,这些 V0 原型实际上正在取代商业计划书 (pitch decks)。到你进行演讲的时候,如果没有一个可用的前端,那会是很罕见的事情,因为成本已经变得如此之低。而且我认为,它为潜在的构建者们带来的迭代速度是惊人的,你可以在确定第一个想法之前,用 V0 尝试数百个原型。
AI 工具中的质量与开发者体验
Pat Grady: 对于今天的 V0,你最自豪的是什么?又觉得哪里还不够完善?
Guillermo Rauch: 最自豪的是它的覆盖范围。超过 300 万构建者,用户参与度和留存率都非常高,这意味着人们和团队确实从中获得了巨大价值。财富 10 强的公司也在企业级服务中使用这个产品。所以,我认为最重要的一点是,人们对代理 (agents) 感到兴奋,而这是一个真正在现实世界中工作并提供价值的代理。
我感到自豪的一件事是,我们从构建 V0 中汲取了大量经验,并将其回馈给世界。我们详细地写了关于我们如何构建它的文章,我们开源了底层的框架,即 AI SDK。我们最近还发布了 V0 模型,邀请创业者在这个领域进行创新,创建他们自己的、可以构建网站、应用程序、市场营销产品等的代理。
另一件值得自豪的是质量。从一开始到现在,正如你所说,任何使用过 ChatGPT 的人都很快意识到,它能写俳句,能写诗,还能写代码,这非常酷。但要让它变得可靠,需要做大量的工作,包括微调 (fine-tuning)。我们训练了我们自己的定制代码应用模型,它位于前沿模型的前端,所有这些都是为了可靠性。你希望进来,创建一个生成,它就必须能正常工作。
Pat Grady: 是的,我认为多年来,甚至在 V0 出现之前,你就以高质量和卓越的开发者体验而闻名。我知道这其中有品味 (taste) 的因素,但我也好奇,你是如何将其系统化的?质量有标准的定义吗?或者你是否跟踪某些指标来确保高标准和完美的开发者体验?
Guillermo Rauch: 是的,构建 AI 产品让我非常兴奋的一点是,反馈循环和指标是内置的。你可能看过很多创业者的融资演讲,他们可能本末倒置,没有正确地跟踪增长和衡量数据。你会想,如果每个产品都带有一套标准指标,让你一开始就有方向,那该多好。AI 产品就内置了这种特性,这非常棒。
比如第一个 AI 编码产品 Copilot,它的工作方式是,在你写代码后,它会生成一段“幽灵文本” (ghost text) 来提议补全。这让创造者有了一个非常酷的指标来评估产品进展,那就是补全的接受率。这就像你在开发产品,然后有一个仪表盘,上面有一个巨大的指标显示:“好了,我们现在是 51%”。下一周回到办公室,“哦,太酷了,我们达到了 52%”。你替换了模型,“好的,我们看看效果如何?”
我非常喜欢这一点。我们在 V0 中大量应用了这种方式,因为我们知道人们想要将这些应用部署到现实世界中,这对我们来说是一个非常强烈的参与信号。我们还会关注应用后来的情况,比如人们是否访问这个应用,他们安装了哪些集成。但我们还有一个最基本的指标,那就是代码是否能工作?它是否能正确渲染?所以,产品的一部分是创建功能性应用的可靠性,而另一部分则更主观,那就是品味。
我们如何将多年来在 Web 上创建产品时学到的所有最佳实践嵌入其中?比如一些小细节,在 iOS 上打开网站时,你要确保主题栏 (theme bar)——也就是网站外部的 Safari 浏览器主题栏颜色——与页面的背景色相匹配。如果不匹配,大多数人可能不会注意到,但当它匹配时,那种愉悦感是无与伦比的,就像画布的延续,占据了整个屏幕。过去,我们必须通过构建框架或进行教育,希望人们能升级。而现在,我们可以将所有这些经验教训嵌入到模型中,告诉它:当你要生成一个登陆页面时,确保做到这一点。
这贯穿了许多方面,所以我称之为“框架之后”的下一个事物。因为框架,无论是设计者还是用户,都付出了巨大努力,试图把你引向一个“成功之坑” (pit of success)。只要你遵循框架,很多关于性能、安全等方面的事情都会水到渠成。但世界是动态的,人们是多变的,他们想尝试不同的东西。所以,现在我们有了一个非常强大的工具,能以一种极具扩展性的方式提供这种指导,这真的很好。过去,我们谈论的开发者世界可能只有几百万到上千万,而现在我们可以将这种指导和方向传递给更广泛的人群。我认为,对于今天开始学习构建软件的人来说,这是一个激动人心的时刻,因为在某种程度上,你们正在跨越前一代人。前一代人通过他们的经验和艰苦的教训学会了如何构建这些界面,但今天进入软件领域的人们,却能够接触到我们所有人集体学到的知识,这非常令人兴奋。
Vercel 的历程与愿景
Sonya Huang: 我很喜欢。在深入探讨 AI 之前,我们能退一步吗?能否为我们介绍一下 Vercel 是什么?你如何看待贵公司在世界上的角色?以及我们一直在谈论的 V0 等 AI 产品,如何融入到前 AI 时代的 Vercel 中?
Guillermo Rauch: Vercel 的诞生源于我将一个前沿网站上线时感到的痛苦。一方面,我必须从头开始配置所有的云服务商,尽管在改进云和开源方面有很多进展,比如 Kubernetes 等,但仅仅是将我的想法放到网上就非常痛苦。
另一方面,我在工具方面也感同身受。在 Vercel 出现之前,我觉得将工具和云基础设施结合起来非常困难,这也是 Next.js 诞生的原因。但最终的目标始终是:我希望立刻将我的想法变为现实。所以,Vercel 的第一章可以看作是“自动驾驶的基础设施” (infrastructure on autopilot) 或“自主云” (autonomous cloud)。我们通过卓越的开发者体验来实现这一点,这就像一个特洛伊木马。你想自动化云?你怎么做?是开课、卖认证,还是为人们提供地球上最好的开发者体验?我们选择了后者。
Vercel 的第二章感觉像是后框架时代。我们已经自动化了基础设施,那是否可以从一开始就自动化编写软件呢?框架的回报是递减的,比如我们曾痴迷于创建酷炫页面或组件需要多少个字符。当我介绍 Next.js 时,我会说,创建它需要的最少步骤是什么?创建一个文件夹,在里面创建一个文件,然后导出第一个 React 组件。我几乎把它变成了一门数学科学,计算从你到“啊哈”时刻并成功上线之间需要多少字符。
随着 AI 能够生成代码,我认为我们正在开启一个全新的领域,有可能实现一切自动化,并将人类置于创造性的主导地位,专注于“我想交付什么?”。实际上,当你在 V0 的提示框里,“你想交付什么?”正是我们提出的问题。
Pat Grady: 你有哪些坚信不疑的信念?随着 AI 生成代码的兴起,这些信念有改变吗?
Guillermo Rauch: 关于坚信不疑的信念,我想说的是,我鼓励人们不要有太多这样的信念。每当有人说“AI 做不到这个”时,我总是试图站在 AI 的一边想,“嗯,我发现自己也曾这么想,但六个月、三个月或九个月后,情况就变了。”
这是其一。另一个对我来说很重要的一点是,我们都在致力于创造一个想与世界分享的成果或产物。所以我总是从第一性原理出发思考:在这一代软件中,一切都可以被重新定义,任何关于谁能构建什么的习惯或假设,我认为目前都处于被颠覆的状态。
我经常拿聊天应用举例,因为假设你们明天要创业,你们会采购哪些工具?首先安装什么?在哪里追踪价格?我认为所有这些都将被 AI 颠覆。我喜欢总是从一张白纸开始思考,这大概是我坚信不疑的信念。我的一个习惯是,每个周末都尝试从零开始做点什么,比如使用 Vercel。这样一方面我可以亲自体验平台,另一方面我也总是在思考:我们还能移除什么?如何消除从想法到应用的摩擦,让新事物上线?
Pat Grady: 你提到开发者体验优先,这在考虑基础设施之前是最重要的。你们做了哪些事情来打造卓越的开发者体验?你认为在 AI 驱动代码的第二幕中,一个卓越的开发者体验会改变吗?
Guillermo Rauch: 是的,首先我们很早就意识到,在某些方面,世界的优先顺序是颠倒的。人们对技术和云基础设施非常兴奋,所以开发者会从这里开始。你会通过创建一个集群、资源、云模板 (cloud formations)、Terraform 等来启动你的项目。但实际上,如果你从第一性原理出发,你并不是要创造基础设施来给你的客户。
你必须始终从最终用户的角度倒推。我给想进入开发者工具领域的人的一个建议是,记住你有两个客户:一个是你的直接客户——开发者,另一个是你要思考的——那个开发者想为他的客户创造什么?这是一个强大且智力上具有挑战性的位置,因为你在思考,我卖东西给你,你再卖给别人,所以这天然就多了一层交互。
我认为我们做得很好的一点是,我们致力于创造一个服务于用户体验的卓越开发者体验。我始终将最终用户放在心上。我经常做的一个练习是,去一个新上线的 AI 产品网站,作为最终用户体验它好不好?感觉如何?然后倒推是什么在驱动它。这有时会产生一种创造性的张力,因为如果我是为了你这个开发者,我可能会卖给你一些能让你短期快乐的东西,就像游戏里的“+10 幸福点”。但几个季度后,如果你的用户不满意,你的短期满足感并不会转化为成功的商业成果。
所以你必须非常谨慎地处理这种张力。早期我有时会犯错,比如让开发者对某个新功能或甚至一个额外的配置选项感到极度兴奋,或者有时是放宽某个操作限制。这总是会吸引那些想做基础设施的创业者,因为开发者喜欢奇怪的东西。你会想,“我要把它设为无限制,大家肯定会喜欢”,但后来你发现,“无限制”并不是卓越运营的好方法。你必须考虑所有将要处理这个具有无限属性的实体的服务和基础设施。这是一个处理这种张力的好例子,因为如果你买我的产品,你可能会想,“为什么配额不是无限的?”而我有时很难解释清楚。所以,处理好这种张力是成功的关键秘诀之一,而且很难做到。
AI 在客户支持和业务转型中的作用
Pat Grady: 你能谈谈 Vercel 的 AI 转折点吗?我记得去年你公布了一些数据,能否分享一下 AI 在多大程度上改变了你们业务的整体速度?
Guillermo Rauch: 我想我们旅程中最显著的两件事是:第一,V0 让我们整个用户群的数量实现了同比翻倍。这让你得以一窥未来开发者的样貌。我们花了好几年时间,作为一家颇受关注的成功公司,才积累了一定的用户基础,而现在 AI 极大地拓宽了入口,让用户数同比翻倍。这让我感到非常惊讶,也鼓舞了每一个想在 Vercel 上构建 AI 应用的人,因为我认为他们将能参与到这个千载难逢的巨大机遇中。V0 的有趣之处在于,它是一个在 Vercel 上创建的全栈应用,没有任何技巧或特殊功能,我们只是成为了自己平台的客户。看到这一点非常酷。
Pat Grady: 这些新用户和你们的老用户有什么不同?
Guillermo Rauch: 他们在某些方面不同,但在另一些方面又相同,那就是他们都在考虑最终用户。不同之处在于,他们对某些开发者的敏感点并不在意,比如他们不太关心代码是长是短,或者 LLM 生成的 API 的形态。有趣的是,LLM 的优缺点将影响未来运行时 (runtimes)、语言、类型检查器 (type checkers) 和框架的发展。
你可以这样想,你的客户不再是开发者,而是开发者或非开发者使用的代理。这是一个相当重大的变化。我最初的假设是,开发者天生偏爱简短的东西。比如,如果 API 调用看起来更简洁,就像 Stripe 的 API,它的点符号 (dot notation) 和 SDK 设计非常优美,顺便说一句,这在未来仍然会非常重要。但现在你必须思考,我能否对 API 做一些改变,使其更有利于 LLM 这个“实体”或用户来使用?这是我们在产品思考方式上的一个巨大变化。
我认为这些新用户有一个与我们所有人共通的根本点:他们只希望东西能用,而且可能耐心更少。开发者会经历一个学习处理错误的过程,他们习惯了。我有时说,开发者通常薪酬很高,但他们整天都在处理糟糕的负面反馈。类型检查器,甚至是更可怕的借用检查器 (borrow checker),会不停地对你“尖叫”,给出难以理解的错误,这也是开发者体验如此重要的原因。现在我们进入了一个新世界,我觉得这些用户的“导火索”更短,如果出了问题,他们可能会立刻“掀桌子”。老实说,这对我们产品构建者来说是巨大的压力,因为你想要的是一个 99.99% 的时间都能正常工作的东西。
当人们问我,如果现在是 1990 年,互联网正开始蓬勃发展,2000 年代即将来临,我们处于哪个阶段?是互联网泡沫时期,还是之前或之后五年?我们正处在一个非常有趣的时代。一方面,你注意到基础模型的可靠性非常低,AI 服务提供商的 API 经常中断。但另一方面,消费者端的普及率却非常高。我们花了很长时间才让每个人都加入“互联网团队”,但“AI 团队”的接纳速度却快得惊人。这就像一个双城记:基础设施还在建设中,我们不断提高其可靠性,而消费者需求却前所未有地高涨。
AI 驱动的基础设施的未来
Pat Grady: 你认为 AI 如何改变底层基础设施的需求?例如,我对 Vercel 的粗浅理解是,你们做了大量的缓存 (caching),使得网站加载非常快。在一个内容大量生成的世界里,这还重要吗?
Guillermo Rauch: 我想说,我们优化的一个主要方向让我们在正确的时间出现在了正确的位置:我们注意到网络正从静态 (static) 转向动态 (dynamic),而现在我觉得我们正从动态转向生成式 (generative)。Vercel 多年来一直投资于从静态到动态的转变,我们致力于开发流式网站 (streaming websites) 技术。像 Amazon.com 这样的网站之所以如此之快,其神奇之处在于它们向你流式传输响应。
这其实有点像一个 LLM,可以看作是 AI 之前的某种 LLM。因为当你访问一个产品页面时,它们会为你实时动态计算产品推荐,预测你接下来可能购买什么。我们都经历过那种情况,你把商品加入购物车,然后它们会提示你“再滚动一下”,然后你就会把捆绑商品也加进去,因为“购买此商品的顾客也购买了...”。Vercel 一直在努力普及这种技术。我们注意到,大多数电商网站甚至连提供一个缓存页面都很困难,更不用说为每个用户提供精准推荐的页面了。
我们得以复用大量的基础设施,特别是在计算方面。我们称之为流体计算 (fluid compute),它非常适合新一代从 LLM 而非数据库流式传输内容的应用。一个重大的转变是,你不仅要为最终用户和人类设计一个网络,比如你打开 sequoiacapital.com,你还必须为代理 (agents) 设计一个网络。你必须考虑到新兴协议的出现,比如 llm.txt 就是一个很好的例子,虽然简单,但它能让网站更好地与潜在的代理沟通,并提供另一种表示形式。你可以把 MCP 服务器看作是这方面的下一个演进。
在某种程度上,从静态到动态的比喻在 AI 协议上以更快的速度发生。llms.txt 很像一个代理化网站 (agentic website) 的静态表示,而 MCP 则使你能够将一个能与其他代理通信的代理发布到互联网上。所以,Vercel 现在正在支持这些新型的 AI 工作负载,同时共享大量相同的基础设施。
Pat Grady: 你认为你们的 AI 产品路线图会走向何方?
Guillermo Rauch: 我最近发了一条推文说,我认为很多公司都会经历一个过程:从没有 AI,到成立一个 AI 原型团队,再将原型演变成生产级产品,成立 AI 产品团队。最终,每个公司都将成为一家 AI 公司。这意味着,你从那个 AI 原型或想法的产品化过程中学到的任何经验,都将被用来改造你业务的其他部分。
你可以从 AI 客服 (support AI) 中看到这一点。为什么 AI 客服如此成功?因为它是任何现有企业或公司将 AI 融入业务的最低摩擦方式。Vercel 所做的比这更有野心,因为我们认为,为了提供高质量的支持,我们需要一个关于我们技术的专家模型。如果一个客户来找我们——我们是 Next.js、React 和 Web 领域的专家——而我们的支持代理却不了解我们自己技术的最新动态,那将是毁灭性的。
所以,我们开始探索如何拥有一个关于我们自己技术的专家 AI。我们推出了 V0,它有两个目的:它既是为我们支持渠道提供信息的专家模型——如果你访问 vercel.com/help 寻求帮助,它会利用我们为公司创建的这个全球智能体;同时,我们也想确保 Vercel 的每一位员工——我们雇佣了一些最优秀、最勤奋的人,他们精通 Web 和云基础设施的方方面面——的知识能够被利用。很多公司来找我们,希望能雇佣我们提供专业服务或支持。通常我们的回答是,我们有超过 10 万个客户,我们提供全面专业服务的能力非常有限,但我们很乐意帮助你。现在我们有了一种机制,我们可以向他们出售我们的 AI 代理,让他们能够直接接触到我和我们 CTO 的“大脑”来解决问题。
然后我们还有 V0,它试图做得更具野心,直接为他们编写代码。所以在很多方面,你可以从提供地球上最优质客户服务的角度来看待这一切颠覆。客户一直问我们,“Rauch,你能不能来办个工作坊?”我很多年前确实办过一个关于 Next.js 的工作坊,我希望我有更多时间去做这些。所以,AI 感觉就像是我们业务的“人类放大器”,是 Jensen Huang 所说的我们业务的“代币工厂” (token factory)。
另一个巨大的变化是,当你审视我们业务的其他领域,如防火墙、安全、可观察性等我们云平台的所有基础,我们也在用 AI 颠覆它们。想象一下,一个代理不再是报告你的工作负载出现 500 错误,而是直接给你一个带有解决方案的拉取请求 (pull request),而这背后依赖的正是让我们擅长生成应用的那些系统。我们将用它们来修复和优化生产环境中的应用。
Pat Grady: 我们距离完全自动驾驶的基础设施还有多远?我知道你们已经自动化了很多,但距离你刚才描绘的景象还有多远?
Guillermo Rauch: 我认为我们实际上已经快到了。这取决于每个具体领域。在最好的情况下,Vercel 能够为任何类型的工作负载自动扩缩容;在最坏的情况下,我们也能为你遇到的任何问题提供一个完全自主的、非常好的调查分析。
Pat Grady: 嗯。回到公司的演进,我认为最大的难点在于,你必须先搞定开发者体验,才能获得自主基础设施带来的所有好处。让我兴奋的是,现在你甚至不需要说服开发者了,如果是由代理来遵循框架的“成功之坑”,那么这个自主基础设施就能产生更广泛的影响。
AI 在搜索和内容创作中的应用
Pat Grady: 也许与此相关,为什么 ChatGPT 成为了你们如此有效的新客户和潜在客户来源?
Guillermo Rauch: 是的,我们最近分享过,来自 ChatGPT 的 Vercel 注册用户数量呈指数级增长。我认为有几个因素。当我们创建 AI SDK——你可以把它看作是 AI 领域的 Next.js,一个让开发者连接 LLM 的框架——时,我们发布了一个“游乐场” (playground),可以让你同时与多个 LLM 对话。它会创建一个分栏布局,你可以问“可口可乐和百事可乐哪个更好?”,然后看到所有不同的 LLM 回答他们的看法。我们利用这个系统来了解不同 LLM 对各种技术的“内在感觉” (innate vibes)。
我无法确切告诉你这些神经网络是如何思考的,事实上,LLM 的可解释性本身就是一个研究领域。但随着时间的推移,如果你问它“部署一个 React 应用的最佳方式是什么?”,基于它所有的训练数据、所有的观点、文章、解决方案和 GitHub 问题,它很多时候会选择 Vercel。
前几天在旧金山的 AI 工程大会上发生了一件趣事,我觉得这标志着时代的变化。我们有一个展位,我的一位同事告诉我,有人来到我们的展位说,他们是因为 ChatGPT 告诉他们要使用 Vercel 才了解到我们的。这在某种程度上改变了市场营销的方式,对吧?过去人们可能是因为看了这样的播客才了解 Vercel,虽然某种程度上这还会继续发生,但现在人们会直接去找他们的“AI 伙伴”来了解世界。
Pat Grady: 完全是。
Guillermo Rauch: 另一方面,AI 仍然依赖搜索来获取最新的突发新闻数据等,所以它们会进行谷歌搜索。因此,我总是建议我们的客户仍然要注意:你仍然需要在搜索中排名靠前并创作好的内容。我认为未来你要创作的内容类型会有所不同。你需要思考,人们在处理某些问题时不再进行基于关键词的搜索,而是在提问。这些问题在某些方面可能更精确,在另一些方面可能更宽泛。所以我们也一直在尝试以 LLM 优先的方式来发布内容到互联网,并且取得了一些不错的效果。有人推测,仅仅创建常见问题 (FAQ) 类型的内容就很有帮助,因为这能一对一地匹配人们可能提出的问题。
总的来说,我认为这对互联网来说是一个很好的结果。我们都在提问,而这些机器能够消化答案,帮助我们在这片广阔的网络内容海洋中航行。所以,你不必向 OpenAI 和 robots.txt 文件“出卖灵魂”。
Pat Grady: 没错。
Guillermo Rauch: 没错。所以你仍然需要考虑:OpenAI 喜欢我吗?Grok 喜欢我吗?等等。希望你和它们都关系良好。
在 AI 竞争格局中航行
Pat Grady: 我很喜欢。你能否谈谈你如何看待竞争格局的演变?在我看来,每个人都在努力实现一个终极目标:你有一个想构建的东西的想法,然后你就能得到一个完整的、已部署的成品应用。但人们采取的方法各不相同,从你们的方式,到“我要赢得 IDE”,再到像 Figma 那样从设计端入手。你认为这一切会如何发展?最终会趋于一致吗?
Guillermo Rauch: 是的,我有几个思考框架。我认为目前没有人能有确切的答案,但我可以分享几个我的思考框架。
虚拟同事与专家代理的崛起
Guillermo Rauch: 一个是“虚拟同事” (virtual co-workers) 的概念。在 Vercel,我们有设计师、开发者、市场营销人员等。未来我们将有虚拟设计师、虚拟市场营销人员和虚拟开发者。你可以把这些看作是代理 (agents),但有一个细微差别:它们是专家代理。我认为,随着时间的推移,人们总是会先从像 ChatGPT 或 Claude 这样的通用知识问答工具开始,但慢慢地,你会发现你总是带着非常具体的问题回来,然后思考“有没有更好的工具?”。
我认为这会自然而然地发生。我们已经多次谈到非常成功的 Vercel 客户,比如 Open Evidence 和 gc.ai。我喜欢这两个例子,因为一个就像我的专家医疗顾问,它有类似 ChatGPT 的界面,但数据源于前沿研究,并且不断改进模型以提供更高的准确性和领域专业知识,这和 V0 在 Web 开发领域做的事情很像。另一个是 GZ.AI,我也很喜欢,因为它在法律领域做着同样的事情。还有 Harvey、FinTool、Hebia 和 Perplexity 等在金融代理问题上提供答案。
所以我预见一个拥有数百万甚至数亿个代理的世界。公司必须思考,如果我是一个数字原生公司,过去我会带着一个 SaaS 风格的仪表盘 UI、一个营销网站和一个内容网站进入市场。现在你必须问自己一个难题:“如果我今天重新创业,我的界面很可能会是代理化的。”
同步代理与异步代理
Guillermo Rauch: 我把代理分为两大类:同步代理 (synchronous agents),比如 Open Evidence 或 ChatGPT,你问一个问题,马上得到答案。我认为这是第一代。然后是更具长期潜力的异步代理 (asynchronous agents),它们可以处理更广泛的问题,可以与其他代理、甚至与你以外的其他人协作,并且可以长时间工作。
我们正在通过像 V0 这样的产品模糊这两者之间的界限,因为有时我们可能会深入处理你给我们的任务,并按顺序协调多个步骤。比如,如果你说“给我建一个最适合电商的界面”,代理可能会先研究一下你到底需要什么,这就像一个额外的步骤。
另一个新兴的类别是 IDE 市场。你的带有 AI 的 IDE 是你的同步代理界面。但当你躺在床上突然有了新想法时,你会说:“嘿,我刚想出解决那个问题的办法了。”然后你告诉代理去处理,并带着一个拉取请求 (pull request) 回来找你。
所以我鼓励人们思考,前端仍然极其重要。你必须考虑输出端的前端,因为在所有工作结束时,总会有一个产物,可能是一个网站、一个拉取请求,或者一条征求你确认的聊天消息。你还必须考虑如何吸引人们的注意力,也就是输入端。如果我是一名医生,我必须记住我要去哪个界面,并且这个界面必须非常人性化 (ergonomic)。
通过对 UI 的大量研究,我注意到代理似乎有自己独特的交互模式,很难将它们与现有事物融合。这就是为什么在 Vercel,我们选择创建一个新的入口和一个新的应用 v0.dev。如果你是谷歌,你面临着一个巨大的挑战,所以他们称他们的代理化界面为“AI 模式” (AI mode),这几乎就像一个独立的产品,就像谷歌地图一样。所以,有一个总入口,你去了谷歌,然后你必须选择你的“战士”:是进入 AI 模式、地图模式、图片模式,还是传统的关键词搜索?
所以我仍然鼓励人们去仔细思考如何找到客户,以及你是否正在为那个智能代理创建一个非常人性化的入口。
Pat Grady: 你能再多说一点,为什么在你们的案例中,把它做成一个独立的产品是合理的?
开发者工具和平台的演变
Guillermo Rauch: 是的,可以把它看作有两类用户。一类是开发者,他们可能正在考虑创建一个更偏向平台的东西。你可能想到的是更有经验的开发者,他们可能已经有了一个现有的基础设施项目,或者一个 GitHub 仓库。他们不会进入一个纯粹对话式的界面。所以他们寻求与 Vercel 进行一种不同的互动。
这就是为什么我总是鼓励人们思考:如果你正在创造未来的 V0,那就去 Vercel,因为你需要一套不同的工具来创建一个平台。我认为世界正在分裂成两类开发者:一类是创建应用的,另一类是创建平台的。如果你在创建应用,我们希望你有一个尽可能简单的入门过程,也就是更具对话性的。如果你在创建平台,我们仍然会为你提供便利,比如模板和有意义的起点,但你仍然需要“卷起袖子”,做一些更传统的开发者工作。
这就是为什么我用 Waymo 来比喻 V0 风格的产品。在理想情况下,Waymo 永远不需要人类操作员,但仍然有很小的可能性会发生脱离 (disengagement),这时 Waymo 会呼叫总部,由人类介入。我认为 Vercel 作为一个平台,更侧重于人类的介入,你在这里创建平台,你更像一个专家,并且在你的旅程中仍然会有很多 AI 工具。而 V0 则是那辆自动驾驶汽车的梦想,端到端,你永远不会脱离。如果万一需要脱离,我们有与代码编辑器的集成,比如你可以说,“好了,我就到这里了,让我把项目导出到像 Cursor 或 VS Code 这样的工具里。”
但我认为,随着 LLM 的不断进步,你会看到 V0 这一端占据越来越多的市场入口。作为一名编码者,我自己已经有一段时间没有使用更传统的编码工具了。我只使用 V0,因为作为 CEO,我的时间和精力有限,我非常执着于从想法到上线的速度,而 V0 完美地满足了这一点。
确保 AI 生成代码的安全与性能
Pat Grady: V0 以及让人们更容易、更无缝地生产软件的整体趋势,几乎肯定会导致世界上出现更多的应用和软件。但这是否也会带来更好的应用和软件,还是只会产生更多的噪音?
Guillermo Rauch: 我认为它肯定会带来更好的应用。为了检验自己,我经常分析我们的客户或我们自己遇到的错误类别,并总是问自己:一个模型能解决这个问题吗?这在我们的产品中表现为严格的评估。比如我之前提到的那个看似愚蠢的例子:Safari 浏览器栏的背景色必须与你的内容匹配。这是可以轻松训练的,然后我们可以将其嵌入并交到数百万人手中。
另一件事是,我们的安全研究团队一直在关注影响网站和 Web 应用的各种漏洞。不久前我分享了一个故事,我们的 CTO 在一个开源框架中发现了一个漏洞。幸运的是,我们帮助他们在该产品版本广泛发布之前发现并修复了它。之后,我们立即对所有前沿的编码模型进行了一次评估,我们给模型们布置了任务:“看,这是那个拉取请求,你发现什么问题了吗?”我记不清有多少个模型答对了,但有好几个答对了。那是一个相当不简单的漏洞。我记得当时我想,这个的下一个版本就是我们可以给 LLM 现有的代码库,让它们花费大量的 tokens 去寻找这样的问题。
果不其然,最近有消息称,有人在 Linux 内核中发现了一个“释放后使用” (use-after-free) 的漏洞,这被认为是高危漏洞,因为它可能导致分段错误、崩溃、拒绝服务攻击,甚至数据泄露、加密密钥泄露、远程代码执行等最严重的漏洞。而这是几乎完全由 GPT-4o 完成的,虽然有一些提示,但并不特别。我与一些经验丰富的 Linux 内核工程师交流过,他们告诉我,现实中确实存在很多这样的漏洞,其中一人甚至轻描淡写地表示,如果他花所有时间去做这件事,他也能找到其他的“释放后使用”漏洞。但问题恰恰在于,Linux 内核专家并不多,他们也没有精力去寻找这类漏洞。
所以,现实是,我认为你会看到 LLM 创造出“天生安全” (secure by construction) 的代码。随着 LLM 在更形式化的语言、在 Rust、在安全语言(顺便说一句,TypeScript 就是其中之一)方面变得越来越好,你会看到 LLM 为世界生产更安全的代码。你会看到,在 AI 编写代码的世界里,下一个“心脏滴血” (Heartbleed) 漏洞将不会发生。
现在,听我这么说的人可能会觉得我太乐观了。我们也听说 LLM 会将密钥泄露到 Web 浏览器中,比如直接将数据库密钥发送到客户端代码里。但我很高兴地告诉大家,V0 已经阻止了成千上万个此类漏洞。我上次与我们的一位 AI 研究工程师确认时,相对于 LLM 本身倾向于输出的代码,V0 每天能阻止一千个漏洞。
这也就是你问我 Vercel 有哪些内在优势的地方。Vercel 拥有一套非常强大的基础设施原语 (primitives),我们可以将 LLM 生成的代码部署到服务器端并立即生效。如果是交互式的,我们可以将其部署到客户端。所以,我们引导 LLM 走向安全结果的能力非常非常强。我们基本上可以自动化地完成我会推荐人类开发者去做的事情,以及我们在文档中建议的做法。
但不仅仅是安全,还有性能。我们非常期待能有代理自动进行性能优化,而这些优化至今我仍在手动向创业者推荐。我说真的,我会在 X (Twitter) 上私信你,或者发短信告诉你:“哦,我在这里发现了一个小问题,框架很难发现。”为什么难发现?因为它们发生在运行时。
Web 工程之所以极其复杂,其中一个原因就是它不是一个离散的过程,不是一个输入立即产生结果的函数。用编程语言的术语来说,它像一个生成器 (generator),会随着时间产生多个值。所以当你访问一个网站时,它是随时间给你信息的。要让一个网站性能好,你视网膜看到的一切都必须在正确的位置。像苹果这样的公司在这方面做得非常出色,因为很多东西都是通过真人测试来判断感觉是否对。他们做大量的演示,有一种在产品发布前先让人们上手的文化。
所以,我想做的是,把所有这些任务交给一个 AI,让它来进行质量判断、性能优化,并基于生产环境中捕获的所有数据,让你的软件在下一代变得更好。现在计算机视觉代理也越来越好,你完全可以派一个代理去点击浏览,看看体验如何。
Pat Grady: 当然,就像一个代理,它只是使用产品并发现问题。我看到的许多创业公司的陷阱就是,我根本无法登录或注册你的产品。就在这个周末,我的一个爱好任务是尝试了语音转文本操作系统类别中的每一个产品,这个领域现在非常火。有三个产品被广泛使用,其中两个我在到达“啊哈”时刻的关键阶段都遇到了问题,包括访问网站、下载应用、注册、授予操作系统权限等。这是一个非常精细的过程,实际上是一个硬核的分布式系统问题,任何环节都可能失败,而你正在优化的就是这个宝贵的“啊哈”时刻。系统是如此动态,我相信创业者们在某个时刻肯定觉得“这绝对稳了”,但太多事情可能出错,你真正需要的是一个质量保证 (QA) 代理,不断地检查这些东西,尤其是关键路径,比如购买、注册、联系销售、下载等。亚马逊的 CTO 有一个说法:所有东西在所有时间都在出故障。所以你需要机器人来不断监控一切并修复它。
向生成式和临时应用的转变
Pat Grady: 你认为我们最终会进入一个充满一次性应用 (disposable apps) 的世界吗?当每个人都在不断创造大量应用时,会发生什么?
Guillermo Rauch: 是的,我一直反对“应用是永久性的”这个想法,那种你需要下载和安装的概念。你在 Mac 上会看到,你下载一个 DMG 文件,这是一种临时卷,是过去时代的遗物,我们仍然经常体验到。你挂载一个临时卷,之后还得从 Finder 中弹出它,然后从卷中拖放到应用程序文件夹里。到这时,它才算安装好了,成了一种责任,就像这是你的小狗,你得照顾它,喂养它。然后你才能启动它。
这对我来说太疯狂了,因为我是 Web 派的,一切都应该是即时的。去 chatgpt.com,去 v0.dev,就这么简单。所以我一直在这场哲学斗争中,一方面反对应用商店的守门人角色,不仅是出于理想主义和哲学层面的原因,也因为它们给最终用户带来了延迟和摩擦。你去 iOS 的应用商店,虽然没有 DMG 文件,但你得下载应用,动辄几百兆,下载要花很长时间。
所以我一直觉得 Web 是最终的分发方式,也是承载通用人工智能 (AGI) 的最佳平台。我认为 Web 将是这样一个地方:一切都将是为每个人实时生成的。我认为这比个人软件或临时应用 (ephemeral apps) 的概念更具野心。你甚至不会注意到它是一个临时应用,因为所有东西都将是临时的。
Pat Grady: 是的,这场斗争或者说我的感悟是,我现在对搜索软件有一种厌恶感,因为“我可以直接生成它”这个想法,在我看来,其总延迟要低于寻找、安装软件。
Guillermo Rauch: 我们正处在一场竞赛中。如果生成结果的质量、性能、安全性和可靠性不断提高,那么对于可下载、可安装、甚至需要采购的软件来说,这将是一场无法获胜的战斗。所以我永远支持完全生成式的软件。
Pat Grady: 这很有趣。我正在结合你之前说的“你既要考虑你的开发者客户,也要考虑你客户的客户——最终用户”这一点来思考。这是否意味着,最终你的开发者客户不再是生产一个服务于大量用户的单一应用,而是这些用户各自与开发者在 V0 或 Vercel 上做的某个东西互动,为每个独立用户动态生成应用?
Guillermo Rauch: 是的,为每个独立用户动态生成应用。
Pat Grady: 没错。这太疯狂了。
Guillermo Rauch: 是的,这几乎就像一个直接的人机代理接口。是的,我认为开发者将创造代理,也就是我所说的代理化平台 (agentic platforms)。这就是为什么我提到,如果你的目标是这个,你可能会去 Vercel;但如果你的目标是生成应用,你会去 V0。而 V0 本身可能会成为未来互联网的生成引擎。我们开始看到一些与 Web 浏览器的集成,特别是现在有了模型,人们可以直接从现有应用和分发渠道中实时调用 V0。这场关于用户去哪儿、他们在哪里的前端花费时间的战斗将继续下去,我认为这些是我们需要持续关注的事情。
这让我想起 Jensen Huang 在一次 AI 会议上说的话:“所有像素都将被生成,而非渲染。”这同样适用于你的 Web 体验。非常酷。
快问快答
Pat Grady: 我们用几个快问快答来结束吧?
Guillermo Rauch: 来吧。
Pat Grady: 好,现在最喜欢的 AI 应用是什么?
Guillermo Rauch: 嗯,V0。
Pat Grady: 好吧,除了你自己的宝贝之外,最喜欢的 AI 应用是什么?
Guillermo Rauch: 嗯,好的。我最近非常迷恋一个新的领域,正如我提到的,关于自我颠覆。我从小就以打字快闻名,现在我非常喜欢这个新类别的工具,比如 Superwhisper、WhisperFlow,这些语音转文本应用让人难以置信,玩起来非常有趣。
Pat Grady: Pat 打字很慢,他肯定很兴奋。
Guillermo Rauch: 有趣的是,我其实已经开始上打字课来提高速度了。
Pat Grady: 我们有一次无聊时搞了个打字比赛。
Guillermo Rauch: 哦,太酷了。谁赢了?
Pat Grady: 我赢了,但我和 Andrew 之间差距不大,没有到尴尬的地步。不过我得说,我用两到四个手指就能达到每分钟 90 个词,这相当厉害了。所以,这预示着在 Vercel 未来的成功,因为我们雇佣的都是打字快的人。
Guillermo Rauch: 是的,所以你应该来申请。
Pat Grady: 好的。
Guillermo Rauch: 顺便说一句,非常酷的一点是,智力的进化似乎与运动灵活性有关。比如孩子成长过程中,你给他们做的测试,很小的时候就是看他们的语言能力发展如何,这是一个明确的发育迹象,但也要看他们的灵活性,他们能扔东西、抓东西吗?所以我们都应该继续学习快速打字,但现在这些语音转文本工具快得令人难以置信,这真的很酷。
Pat Grady: 我很喜欢。在 AI 领域,你最欣赏谁?
Guillermo Rauch: Karpathy。有趣的是,当他提出“凭感觉编码” (vibe coding) 这个词时,他谈到使用 Superwhisper,就像“我只要说话,应用就会被生成”。我认为他描绘了一个正在实现的伟大未来愿景,而且他之前在特斯拉也通过自动驾驶做到了这一点,所以是的,他非常鼓舞人心。
Pat Grady: 有什么推荐读物吗?
Guillermo Rauch: 推荐读物,你的 Twitter。
Pat Grady: 我确实很喜欢 X。
Guillermo Rauch: 嗯,好的。我喜欢很多工程类的文章。但有一个我想起来了,是一篇叫做《五个为什么》 (The Five Whys) 的文章,标题大概是《五个为什么以及为什么世界将变得更奇怪》。它实际上谈到了飞机失事,可悲的是今天就发生了一起。文章谈到飞机失事是多么罕见,正是因为它们变得如此罕见,世界一直在研究、添加补丁、协议和修复措施,以防再次发生不幸。这是一个非常有趣的思维模型,虽然文章不涉及 AI,但它谈到了一个未来,在这个未来中,我们已经完善和精炼了太多东西,以至于那些冒出来的事情,那些将出现在你未来 X 信息流中的事情,将是最疯狂的,因为一切都变得太好、太快了,以至于任何打破常规的东西都会从零迅速席卷全球。你开始在创业公司中看到一点这种迹象,我不知道你是否注意到,它们增长的速度,以及它们为了做大或吸引注意力而做的那些有时很奇怪的事情,虽然我并不完全赞同,但这篇文章完全预言了 AI 世界的未来。
Pat Grady: 什么是被过度炒作的?什么又是被低估的?
Guillermo Rauch: 我认为被低估的。哦,被低估的太容易了。LLM 的能力非常强,有太多伟大的应用可以被创造和发布。所以我认为,即使我们冻结现有的一切,世界将获得的价值,未来将看到的成功创业者数量,都将是巨大的。这是一个新的平台,一次平台转移,它需要你重新布线你的大脑,这非常困难。幸运的是,有些人将直接出生在这个时代,他们将看到巨大的机会。作为一个从未学习过旧世界知识的工程师,现在却能... 我最近的一条热门推文几乎像一个忏悔。我觉得,我越是诚实地承认,AI 就像一个你可以信任并倾诉一切的知己,尤其是在不问“愚蠢”问题方面。没有什么问题是愚蠢的,没有尴尬。所以,你在世界模型、心智模型以及你将要精通的事物上的进步速度,将是惊人的。过去你受限于你的个性,如果你有点内向,可能不太敢问重要而有趣的问题,现在你可以问世界上任何问题,并在任何事情上变得擅长。你真的可以无所不知。我真的很嫉妒今天在这种“心灵魔法”中成长起来的人。
至于被过度炒作的,你知道,我持一种非常长远的观点,所以很难找到真正被过度炒作的东西。我会在比特币顶峰时对它感到兴奋,我会对加密货币感到兴奋。多年来我一直对加密货币保持热情,无论熊市还是牛市,因为我知道,所有货币终将数字化,所有软件终将是 AI。所以,如果你持一种非常长远的眼光,就很难说某个东西被过度炒作了。
Pat Grady: 很好的回答。最后一个问题,时间线。你认为我们什么时候能达到那种“生成式网络”的乌托邦?
Guillermo Rauch: 我认为在未来五年内,我们将看到网络在其界面、人们的习惯以及参与网络创造者数量方面发生史上最大的变革。甚至五年听起来都太长了。我甚至会说,在未来三年内,我们将看到一些“王国”的崩溃,那些诞生于互联网但未能足够快地做出调整的公司,以及新的 AI 原生公司将如我们之前所说,以空前的高度迅速崛起。
Pat Grady: 太棒了。Guillermo,非常感谢你花时间与我们分享你对网络未来、生成式网络以及 Vercel 在其中扮演的角色的愿景。
Guillermo Rauch: 谢谢你们邀请我。这很有趣。
Pat Grady: 谢谢你。
