【城主说】YC今天发布了其总裁Garry Tan(陈嘉兴)对当红AI编程一哥 Cursor 的创始人CEO 迈克尔·特鲁尔(Michael Truell)的访谈。迈克尔·特鲁尔分享了Cursor的终极目标——用一种更高级、更直观的方式彻底取代传统编码,并揭示了其在AI时代构建产品护城河的独特见解,以及对未来软件工程师核心价值的深刻思考。
核心观点
-
• 终极目标是取代编程:AI的未来不是辅助编码,而是发明一种全新的、更高级的软件构建方式,让人们只需描述意图即可。
-
• “品味”是工程师不可替代的价值:当AI处理实现细节后,工程师的核心竞争力将转变为对产品方向、逻辑运作和美学的高层次“品味”。
-
• 构建编辑器而非扩展:为了真正革新编程体验,必须控制整个用户界面。构建一个独立的编辑器,而不是受限于现有平台的扩展,是实现颠覆性创新的关键决策。
-
• 数据飞轮是核心护城河:在AI时代,真正的护城河类似于早期的搜索引擎,即通过大规模用户分发获取数据,理解用户行为(如接受、拒绝、修正代码),从而不断迭代优化产品和底层模型。
-
• 顺应AI发展曲线:公司战略应建立在“AI模型将持续变得更强大”这一预判之上,提前布局,以抓住技术浪潮带来的颠覆性机遇。
一 | 终极愿景:取代而非辅助,发明全新的软件构建范式
与众多AI编程助手致力于“辅助”开发者的定位不同,Cursor的最终目标显得更为宏大和颠覆。特鲁尔明确表示,他们的使命并非简单地提高编码效率,而是要从根本上取代编程这一行为本身。
我们公司的目标是用一种更优越的方式取代编码。……我们认为,在未来五到十年内,将有可能发明一种新的软件构建方式,这种方式将更高级、更具生产力。这仍然归结于定义你希望软件如何运行以及你希望软件呈现什么样子。
他认为,尽管目前的AI主要扮演“助手”角色,帮助开发者编写了约40%到50%的代码,但这只是过渡阶段。真正的未来是,开发者将从繁琐、晦涩的编程语言中彻底解放出来,只需通过更接近自然语言的方式描述意图,软件即可被构建和修改。Cursor的战略是在当下成为最好用的AI编码工具,并最终引领这场从“编码”到“意图表达”的范式革命。
二 | 工程师的未来价值:“品味”将是不可替代的核心竞争力
当AI越来越多地接管“如何实现”的底层工作后,什么将成为工程师最有价值的技能?特鲁尔的答案是:品味(Taste)。
这里的“品味”超越了视觉美学,深刻地指向一种对软件逻辑的高层次判断力——即对“应该构建什么”以及“它应该如何运作”的正确直觉和深刻理解。他将许多繁琐的编码工作比作“人工编译”,工程师需要费力地将高层次的想法翻译成机器能够理解的语言。随着AI自动化这一过程,决定产品成败的关键,将更多地取决于这种高层次的构想和设计能力。
我们认为,品味将是不可替代的。……我认为越来越多像人工编译这样的步骤将会消失,计算机将能够填补空白,完善细节。但既然我们的工具正在帮助你实现事物,帮助你构建事物,那种对于什么是真正有用、对于你想要构建什么的品味,我认为永远不会消失。
这意味着,未来工程师的核心价值将从精通语法和算法细节,转向拥有卓越的产品感、逻辑设计能力和对方向的精准把握。
三 | 关键战略决策:自建编辑器,而非受限的扩展
在产品形态上,Cursor早期做出了一个在当时并非共识、甚至招致批评的决策:构建一个独立的编辑器,而不是开发一个依附于现有IDE(如VS Code)的扩展程序。
这个决策源于他们对未来的一个核心预判:AI将彻底改变编程的交互形态。如果仅仅是做一个扩展,将永远受限于宿主平台的API和界面限制,无法实现真正颠覆性的创新。为了完全控制用户体验,并为未来更高级的交互范式(如直接操作UI、更高阶的逻辑语言)铺平道路,拥有自己的“画布”至关重要。
我们早期做的一个非普遍共识的产品决策,源于对一个更具颠覆性未来的兴奋,那就是不构建扩展程序,而是构建一个编辑器。……这源于一种想法,即所有的编程都将通过这些模型进行。它在未来会看起来截然不同。你将需要控制用户界面。
事实证明,这一决策为Cursor的快速迭代和功能创新提供了巨大的自由度,是其能够超越众多竞争对手的关键一步。
四 | AI时代的护城河:数据飞轮与顺应发展曲线
在AI技术日新月异的背景下,如何构建持久的护城河是所有创业者面临的核心问题。特鲁尔认为,AI时代的可持续竞争优势,类似于90年代末的搜索引擎市场,其核心在于由大规模分发驱动的数据飞轮。
搜索的一个特点,我认为也是我们市场的一个特点是,分发对于产品的改进非常有帮助。……对我们而言,就是要观察人们在哪里接受了某些事物?他们在哪里拒绝了某些事物?……我认为这将是未来让产品和底层模型变得更好一个非常非常重要的驱动力。
通过服务海量用户,Cursor能够收集到关于AI生成代码的宝贵反馈——用户接受了什么、拒绝了什么、以及如何修正——这些数据反过来可以持续优化其底层的定制模型和产品体验,形成一个正向循环。
同时,他强调公司的核心战略必须建立在 顺应发展曲线 的信念之上,即坚信AI模型将持续变得更强大,并基于这一预判来布局产品和技术路线,才能在技术浪潮的变革点上抓住颠覆性机遇。
从一个探索机械工程CAD工具的项目,到成为AI编程领域的现象级产品,Cursor的崛起根植于其创始团队对编程未来的“无所畏惧”的雄心。迈克尔·特鲁尔相信,我们正处在一个构建能力被极大放大的新十年。未来,不仅专业开发者的效率将得到极大提升,更多的人也将有能力构建满足自身需求的利基软件。
天空之城全文整理版
迈克尔·特鲁尔:
对于我们而言,最终目标是用更好的东西取代编程。我认为这将是这样一个十年:你仅仅是构建的能力将被极大地放大。如果你比其他人更快地推动前沿,你就能获得巨大的收益。创办公司很困难,所以你不如去从事真正让你兴奋的事情。所以,是的,我们着手研究代码的未来。
陈嘉兴: 欢迎回到YC播客《如何构建未来》的又一集。今天,我请到了AnySphere的联合创始人兼首席执行官迈克尔·特鲁尔,AnySphere正是我们所熟知和喜爱的AI编程平台Cursor的幕后公司。他们最近达到了90亿美元的估值,是有史以来增长最快的初创公司之一,在推出仅仅20个月后就实现了1亿美元的年经常性收入(ARR)。迈克尔,感谢你的加入。
迈克尔·特鲁尔: 谢谢你们的邀请。很高兴来到这里。
陈嘉兴: 您曾说过,Cursor 的目标是真正发明一种新型编程方式,即您只需描述所需,软件即可构建完成。请您详细阐述一下。
迈克尔·特鲁尔: 是的,我们公司的目标是用一种更优越的方式取代编码。我和我的三位联合创始人,我们长期以来都是程序员。说到底,这就是我们的本质。编程吸引我们的地方在于,你能够非常迅速地构建事物。然而,对于那些描述起来相对简单的事情,编程却需要编辑数百万行晦涩难懂的正式编程语言,需要投入大量大量的工作,才能真正让那些描述起来简单的东西呈现在屏幕上。
我们认为,在未来五到十年内,将有可能发明一种新的软件构建方式,这种方式将更高级、更具生产力。这仍然归结于定义你希望软件如何运行以及你希望软件呈现什么样子。所以我们使用 Cursor 的目标就是实现这一点。而我们达到该目标的方法是,在任何给定时间点,始终成为结合人工智能进行编码的最佳方式,然后演进这一过程,使其脱离传统编程,演变为截然不同的东西。
理想与现实:我们离未来还有多远?
陈嘉兴: 所以有些人会说,这正是我们今天所拥有的。你只需描述你想要什么,它就实现了。对此您有何看法?我们已经达到那个阶段了吗?那么,要达到您真正想去的地方,需要哪些步骤呢?
迈克尔·特鲁尔: 我们正在看到事情真正开始变化的最初迹象。我认为你们与 YC 可能正处于其前沿,因为我认为在较小的代码库中,由较少的人员组共同开发一个软件项目时,在那里您对变化的感受最为强烈。在这种情况下,我们已经看到人们超越代码层面,提升到更高层次的抽象,并基本上要求智能体和人工智能为他们完成所有更改。
我认为在专业领域,我们仍有很长的路要走。我认为那种不求甚解地编程,或者在不真正查看和理解代码的情况下编程的整个想法,实际上行不通。这会产生许多n阶效应。毕竟,如果你正在处理数百万行代码,并且有数十甚至数百人持续多年地从事某项工作,那么目前你真的无法仅仅避免思考代码本身。
我们的主要重点是帮助专业程序员,帮助那些以开发软件为生的人。在这些环境中,人们越来越多地使用人工智能来编写代码。平均而言,我们看到人们使用AI编写了Cursor中生成的代码行数的40%到50%。但这仍然是一个阅读AI生成的所有内容的过程。因此,作为一款产品,我们需要跨越的一个重要鸿沟将是达到这样一个阶段:我们不再仅仅是一款帮助您查看、阅读、编写和理解代码的生产力工具,并且代码产物(或成果)的性质也随之改变。我认为对于专业开发人员来说,在这方面仍有很长的路要走。
陈嘉兴: 在你看来,你是否认为它有不同的层级?当然,初创公司通常是从零行代码开始的。所以那非常简单。目前你是否在追踪某个时间点,哦,那就是说,随性编码停止奏效的时候。而那时,事情就变得真实起来。
迈克尔·特鲁尔: 如果你希望代码能长期存在,我们绝对不推荐那种随性编码的方式。我认为,当你是一家两三人或四人规模的初创公司,并且你还在摸索、试图弄清楚自己在做什么时,软件开发的一个特点是代码通常只存在数周。
现在,我们正处于这样一个阶段,人工智能在某种程度上充当着你的助手,对吗?所以,人们使用人工智能进行编码的主要方式是:他们要么将任务委派给人工智能,并说,帮我做这件事,帮我回答这个问题。或者他们有一个人工智能在旁协助,时不时地接管键盘。这就是那种辅助形式。我认为,在接下来的六个月到一年内,关键在于使这两种形式的效用提升一个数量级。旁观别人的工作时,有时编码过程是极其可预测的,你能预知他们接下来10、15、20分钟的工作。因此,这种辅助形式可以发展得非常深入。而将任务委托给另一个人的代理模式也可以发展得很远。
我认为,一旦这些模式开始成熟,并且在25%到30%的专业开发工作中,你可以完全依赖它们端到端地完成任务,而无需太多关注细节。届时,还需要解决所有其他问题,以使这些模式在现实世界中真正发挥作用。
技术瓶颈与未来交互界面
迈克尔·特鲁尔: 一种看待大型语言模型(LLM)的方式是,你像与人类助手一样与它们进行交互。另一种看待大型语言模型(LLM)的方式是,它们是编译器或解释器技术的一种进步。如果我们能成为一个工具,帮助人们将脑海中的想法呈现在屏幕上,并让他们能够掌控最精微的细节,这总是非常有帮助的,对吗?这是我们面临的产品挑战之一,即你总应该能够将某物移动几像素。你总应该能够编辑关于逻辑的某个非常具体的方面。
我认为一个始终有用的用户界面,是能够将软件的逻辑书面记录下来。并且你可以指向逻辑的各个部分,并实际编辑它们。但如果我们能达到一个不必过多关注代码的境地,那么软件逻辑的那个书面记录版本就必须变得更高级。因此,是的,我们很兴奋地思考,在代理程序运行起来,在标签页形式变得非常成熟之后,人工智能是否会实际改变编写和查看编程语言的含义?
陈嘉兴: 这会是一种上下文窗口的体现吗?你知道,这似乎有点道理,一旦你超过大约一百万到两百万个token,我感觉,我们仅仅在过去一百天内才获得了可用的两百万token长度。当你的代码库达到一定规模时,这自然会成为一个节点,届时你必须使用检索增强生成,但它有不完整的上下文,然后就无法做到人类程序员能做到的事情,是吗?
迈克尔·特鲁尔: 是的,我认为智能体达到人类水平存在诸多瓶颈。我认为其中之一是上下文窗口方面的问题,这是一个实实在在的挑战,例如,如果你有1000万行代码,那可能就是1亿个token。要有一个模型能够真正摄入这些信息,使其具有成本效益,并且不仅仅是模型能够物理地将其吸纳到其权重中,还要能够有效地关注该上下文窗口,这很棘手。我认为这是该领域需要努力解决的问题。
而且这不仅仅是基于代码的问题。这也是一个持续学习的问题,比如了解组织的背景,过去尝试过的事情,以及你的同事是谁。而模型真正持续学习某个问题的难题,我认为,该领域仍然没有一个很好的解决方案。人们一直怀疑,或者说很多人认为,只要把上下文窗口做成无限大,问题就解决了。我认为,训练这些模型的机构缺乏真正优秀的长上下文数据。所以我认为那会很棘手。但持续学习和长上下文能力无疑是成为超人类的瓶颈。
这有些相关,但能够跨越非常长的时间范围执行任务并持续取得进展,也是一个关键点。在互联网上流传着一张令人惊叹的图表,展示了过去一两年中,AI在任务上能保持持续进展的最长时间长度的进展。它已经从,你知道的,几秒钟上升到——我不太清楚这些数字具体是如何得出的,但我认为有人声称,一些最新的模型可以达到大约一小时。
此外,还有不同模态的问题。所以,要成为一名软件工程师,你确实需要运行代码,然后调试输出结果。如果没有,你简直会远超人类。那将是不可思议的。因此,计算机操作对于代码的未来将非常重要。能够运行代码,能够查看DataDog日志,并与人类使用的那些工具进行交互。我们将不得不面对许多已知挑战。接着,在使编程智能体超越人类的任务中,我们还将不得不面对许多未知挑战。
接着,我想指出一点,回顾上一个回答,即使你有一个可以在编程方面达到人类水平,或者比人类编程更快更好,甚至超越人类,相当于整个工程部门技能水平的对话对象。我认为,仅仅通过一个文本框来请求修改软件的用户界面是不够精确的。因此,即便到了极致,如果你关心人类能否控制屏幕上显示的内容,你将需要一种不同的交互方式。因此,一种潜在的用户界面是编程语言向更高级别的演进。另一种可能是直接操作用户界面,对吗?能够指向屏幕上的内容,并说:“哦,改变这个”,或者你自己实际微调这些值。
陈嘉兴: 我的意思是,这看起来像是一系列刚刚显露头角、蓄势待发的事物,对吗?例如,这些模型似乎对美学没有真正清晰的感知。那么,关于或许人类关卡设计师需要真正地……他们需要能够看到这一点。
迈克尔·特鲁尔: 看到他们在美学方面有所进步,这很有趣。我认为这实际上是一个有趣的具体例子,说明了我们如何巧妙规避这些持续学习问题。但我们的理解是,教导这些模型在美学等方面做得更好的方式,与教导人类的方式不同。它是通过,你知道的,基本上收集大量数据,并对它们进行强化学习。这就是你教导它完成那项任务的方式。而且这项任务足够多的人关注,以至于你可以承担所有这些工作的成本。而且你可以去训练它,并将其融入到基础模型中。但这算是解决持续学习问题的一种变通之法。
工程师的未来:不可替代的“品味”
陈嘉兴: 那么,鉴于每个人都在努力构建的这种未来,而你无疑是走在前沿的领导者,你认为未来软件工程师的哪些部分将是不可替代的,或者说是必备要素?
迈克尔·特鲁尔: 我们认为,品味将是不可替代的。那么,仅仅是定义你实际想构建什么?人们通常在考虑软件的视觉方面时会想到这一点。我认为,在软件的非视觉方面也存在品味要素,例如逻辑如何运作。而现在,编程行为某种程度上将你弄清楚到底希望事物如何运作,以及你正在编写的逻辑真正在定义什么产品,这些都捆绑在了一起。以及它如何映射到物理计算机上的实现细节方面的高层次品味。
但现在,很多编程就像你正在进行的人工编译,你大致知道你想要什么。你可以告诉另一个人,但你真的必须为计算机详细说明,因为你用来向计算机描述事物的语言,对于常规编程来说,只是你知道的循环、条件语句、变量和方法,你真的必须逐字逐句地解释。因此,我认为越来越多像人工编译这样的步骤将会消失,计算机将能够填补空白,完善细节。但既然我们,你知道的,我们的工具正在帮助你实现事物,帮助你构建事物,那种对于什么是真正有用、对于你想要构建什么的品味,我认为永远不会消失。
陈嘉兴: 这说得通。有这样一句话,优秀的人会帮助你达到这个标准,但真正伟大、真正精通的人,他们能达到一个你甚至无法看到的高度。是的。所以,那需要品味。是的。你曾说过,人们需要成为某种逻辑设计师。那么,就意图驱动编程而言,那意味着什么呢?
迈克尔·特鲁尔: 随着这项技术越来越成熟,随着我们越来越接近一个编程能够自动化并能以更好的方式构建软件的世界。我认为这会带来一系列影响。我认为其中之一就是,专业的开发者将会变得效率大大提高。千人规模的软件项目进展得如此缓慢,简直令人难以置信。是的。百人规模的软件项目以及真正的专业软件项目进展得也很慢。其中很大一部分原因在于现有逻辑的沉重负担,它会让你束手无策。当你在一个新的代码库中时,你可以从零开始。你可以非常迅速地完成工作。当你改变某件事物时,不会有一大堆其他东西随之崩溃,需要你去修复。
我认为其中一个影响将是,下一个分布式训练框架、下一个数据库或下一个可视化设计工具将能更快地构建出来。下一个AI模型也是如此,如果你和那些实验室交流,会发现他们主要受限于工程能力。我认为所有这些都将大幅改善。
我认为,一个二阶效应是,将会有更多利基软件存在。我最早的一份工作实际上是在一家生物科技公司工作。这是一家由湿实验室科学家组成的团队。他们正在研发治疗疾病的药物。我是他们雇佣的第一位软件工程师。他们当时正在生成大量的化学物质,然后将其用于这些生物实验。然后他们需要一个读出结果,以便弄清楚哪些化学物质值得进一步研究。为此,他们需要大量的内部软件开发。令人惊讶的是,市面上现有的工具简直太差劲了。然后,想到这家公司,尽管软件并非其核心竞争力,却不得不付出巨大努力去雇佣一支真正的软件工程团队,并对其进行培训,让他们从事内部产品开发,这简直是不可思议。对于那样的公司而言,将会有更多可用的选项。数字空间的物理特性已经非常出色,但我认为未来这只会得到大幅提升。你期望在计算机上实现的事情,届时就能实现。
Cursor的起源:从CAD到代码
陈嘉兴: 换个话题,我想听听关于Cursor早期的情况。你在麻省理工学院遇到了你的联合创始人——Swale、Arvid和Aman。这家公司始于2022年。是什么让你们走到一起?你们又是什么时候意识到这是一个能够共同成就一番雄心勃勃事业的团队?
迈克尔·特鲁尔: 我认为我们当时非常年轻天真,这种天真在当时可能是没有根据的。所以从一开始,我们就颇具雄心。Cursor实际上源于一次雄心勃勃的构思实践。对于我们四人而言,我们都很早就接触了编程。而我们最早的一些工程项目实际上都与人工智能有关。我们中的一人致力于提高机器人强化学习的数据效率。也就是让机器人能够非常快速地学习新任务。那是我们早期的人工智能项目之一。我们中的另一人致力于构建一个实际上是谷歌竞争对手的产品,通过使用神经网络,试图加速构建一个卓越的网络搜索引擎。其他人则从事人工智能领域的学术研究。
但在2021年,有两个时刻让我们对创建一家专注于人工智能的公司感到非常兴奋。其中之一是使用了首批真正实用的人工智能产品,其中人工智能是真正的核心。而 GitHub Copilot 坦率地说,是那个让我们发自内心地感受到现在利用人工智能创造真正有用的东西成为可能的时刻。而且我们不应该在实验室里,比如在学术实验室里从事这些工作。相反,是时候让这些技术走向现实世界了。另一件让我们非常兴奋的事情是,OpenAI 和其他地方发布的研究表明,存在着非常可预测的自然法则,它们显示如果扩大数据规模并增加投入到这些模型中的算力,它们就会变得越来越好。因此,这意味着即使我们用尽了改进人工智能的想法,仍然有几个数量级的提升空间可以继续探索。
从一开始,我们就想选择一个知识工作领域,然后研究随着人工智能的日益成熟,这种知识工作会演变成什么样子。我们对这样一种公司形态非常感兴趣:即为特定知识工作领域开发产品。因为这能让你做几件事。其一,随着底层技术日益成熟,你可以演变完成那项工作的形态。其二则是,即使在那时,也很清楚地看到,你可能需要的不仅仅是扩大语言模型(比如达到 GPDN)的规模。而持续关注底层机器学习进展的一种方式是,获取产品数据,了解人们喜欢哪些建议?他们不喜欢哪些?还有哪些人工智能仍无法真正触及的人类工作的难点?而如果你是知识工作发生的核心界面,你就能获得这些数据。
因此,最初我们着手将此应用于我们实际上不太了解的一个知识工作领域,即机械工程。我们曾一度致力于开发一款计算机辅助设计(CAD)的辅助工具。因此,我们当时正在训练三维自动完成模型。也就是帮助那些在使用SolidWorks或Fusion 360等软件进行零件三维建模的人,并尝试预测他们将要对几何形状进行的下一次更改。这是一个有趣的问题。也是学术界一直在研究的问题。实际上DeepMind也曾涉足过这个领域。
陈嘉兴: 而这些本身并非大型语言模型。
迈克尔·特鲁尔: 你可以完全以三维形式来做。或者你可以做的是,我们曾致力于的一个方向是将其转化为一个语言问题,即你将某人在CAD系统中执行的步骤,某种程度上转化为方法调用。所以,如果他们正在绘制一个圆,你就把它作为一个方法调用。它就像一个方法调用列表。它算不上真正的编程,但看起来有点像。问题是,如果你打算完全基于文本来做,你要求模型去做一些非常棘手的事情,它不仅要预测用户下一步会做什么,还要在其内部认知中模拟几何结构。因为CAD内核,也就是这些CAD应用程序底层的软件,它们相当复杂。而仅仅通过观察用户执行的动作序列,很难凭空想象出最终成果是什么样子。这相当棘手。
但我们为此努力了一段时间。那里有大量的数据工作要做,大量的CAD数据抓取工作,因为公共互联网上存在CAD数据。我们需要获取这些数据,以使模型越来越好。然后我们搁置了它。这有几个原因。其一,我们对机械工程的兴趣不如对编程的兴趣大。我们都是程序员。另一个原因是,我认为那时的科学技术尚未为3D做好准备。预训练模型在这方面表现不佳。数据量不大。互联网上的CAD模型数据量比代码少好几个数量级。因此,很难构建一个有用的模型。或者说,那时候针对那个领域很难构建一个有用的模型。
陈嘉兴: 你们最终是否去和那些CAD用户,或者... ...机械师以及诸如此类的人交流了呢?
迈克尔·特鲁尔: 是的,我们做了。我们进行了大量的用户访谈。我认为我们本可以做得更好。我认为,这也许再次是年轻时的天真,我们日复一日、周复一周地工作,按小时计算任务。回顾我们在这上面花费的时间,我想,如果当初直接去一家雇用机械工程师的公司工作三周,效果会更好。
陈嘉兴: 就当作是卧底。
迈克尔·特鲁尔: 更深入地了解机械工程的整体面貌。
陈嘉兴: 简单地找一份绘图员的工作。是的,是的。并且亲眼看看人们究竟在做什么。我认为那会非常有价值。
迈克尔·特鲁尔: 用这个替代数百次用户访谈中的一部分,效果会很棒。
陈嘉兴: 我想与此同时,你们也开始训练自己的模型来完成这项工作,并且使用了强化学习(RL)。那也非常有用。并且也学习了如何部署大型集群来实际训练这些模型。
迈克尔·特鲁尔: 是的。所以在那段徒劳尝试的时期,我们当时并不知道。但是的,我们在那里做的一些事情最终对我们很有用。那时主要在做行为克隆,较少涉及强化学习。但当时是在观察人类行为的良好范例,然后训练人工智能去做那些事情。但是的,当时训练参数量达到数百亿级别的大型语言模型,并非很多人都在做的事情。尽管我们当时研发的产品和模型的最终成果并没有那么有用。但它是一次极好的规模化模型训练和规模化推理的演练。当时,坦率地说,即使是现在,也没有那么多人训练100亿以上参数规模的大型语言模型或机器学习模型。因此,基础设施的状态非常非常早期。我们当时在做的事情包括分叉(forking)Megatron LM 或 Microsoft DeepSpeed,然后剥离其内部核心,再将其部署用于训练。
即使在推理方面,在那段时期,我们也有几项大规模运行的工作。如今在 Cursor,我们每天在我们自己的推理系统上进行超过5亿次模型调用。当时进行推理和训练的一些经验,对于 Cursor 的开发和使用体验无疑是极其有益的。
关键转折:顺应曲线,回归初心
陈嘉兴: 所以,有一件事,我是说,首先是极其勇敢,但也是极其有远见的,那就是暂停片刻并表示,实际上我们对CAD了解不足,我们需要做些别的事情。它是从训练CAD模型,并认识到扩展定律正在发挥作用,以及这是一个我们可以涉足的领域,然后直接发展而来的吗?然后你意识到,实际上,我们需要做些别的事情。那么,究竟是什么促使它实际转变为今天的样子?
迈克尔·特鲁尔: 这并非一条直线。我的意思是,我们自己作为程序员,受到Copilot等产品的启发,以及早期Codex论文等文献的启发。我记得当时,我们做的一件事,就是为了向投资者证明他们应该投资我们这个疯狂的CAD想法,我们粗略计算了第一个编码模型Codex的训练成本。据我所知,根据我们的计算,它的成本只有大约9万或10万美元。这在当时真的让投资者感到惊讶,并且在某种程度上帮助我们获得了足够的资金来追求CAD的想法,因为你必须立即开始训练。
所以我们一直都了解编码。我们一直都对此感到兴奋。我们一直都对人工智能将如何改变编码感到兴奋。对于进入并从事那个领域,我们曾有点顾虑,因为已经有很多人在做了。而且我们认为Copilot非常棒。而且当时还有数十家其他公司也在从事这项工作。当我们决定搁置那个有点脱离我们核心理念的CAD项目时,这主要是因为科学上进展不顺,而且我们对那个领域本身也缺乏热情。吸引我们重新投入编程的,是我们的个人兴趣。
而当时给我们信心继续下去的原因有二:其一,是看到他人在大约九个月时间里所取得的进展,尽管感觉那进展比本可以达到的速度慢了一些。其二,是坐下来思考,如果我们真正坚守自己的信念,那么在五年内,所有的编码都将通过这些模型进行。编程行为将彻底改变。为了实现这一目标,无论是产品层面还是模型层面,都需要实现这些飞跃。而且其天花板是如此之高。而且,该领域现有的参与者似乎并没有瞄准一种完全不同类型的编程。他们似乎没有那种雄心,也似乎没有真正为此做好执行的准备。那第一次经历教会了我们,创办一家公司是艰难的。所以你大可以去从事你真正热衷的事情。于是,我们便着手研究编程的未来。
陈嘉兴: 这听起来格外有先见之明,因为大约一年前,萨姆·奥尔特曼曾坐在这把椅子上,谈到如果你与模型变得更智能的趋势作对,那是不明智的。你应该始终相信模型会变得智能得多。12、18、24个月后,这一点被证明越来越真实。听起来,你甚至在那番话被说出整整12个月之前,就已经采取了这种立场。
迈克尔·特鲁尔: 是的,我们当时有个说法,叫做“顺应发展曲线”。你应该始终顺应这条发展曲线,并预判其走向。我的意思是,这有点回溯到规模法则,即这些事物只会变得越来越好。
陈嘉兴: 彼得·蒂尔的经典论断是:你相信什么,而别人都不相信?你相信这一点,而且你是如此正确,正是这一点让你能够真正走向趋势的未来发展方向。
迈克尔·特鲁尔: 是的,我认为这是有帮助的方面之一。而现在,显然它变得更加盛行。但在那时,你知道,2022年是一个疯狂而关键的年份,当你从年初开始时。真的没有人谈论AI。我的意思是,GPT-3在前一年已经发布了。Copilot确实出现了。Copilot在2021年是测试版,然后可能在2022年正式发布。然后它开始流行起来。而且,你知道,我们仍然记得所有InstructGPT的推出,它让GPT-3变得更好了一些。这是对指令进行的微调。接着是夏季的达尔·伊。我记得那是一个令人震撼的时刻,它说服了许多不关注这个领域的人,让他们更多地关注它。但随后出现了庞姆(POM)和稳定扩散。接着你开始接触到人类反馈强化学习(RLHF)。你开始接触到3.5。并且这些模型在训练成本没有大幅增加的情况下变得越来越好,这是一个有趣的发展。但有传闻称,从GPT-3到聊天GPT,训练成本仅增加了约1%,而GPT-3已经存在一段时间,虽然没有给一些人留下深刻印象,但它肯定不像聊天GPT那样具有突破性意义。这得益于对指令的微调、人类反馈强化学习以及其他一些细节。
陈嘉兴: 你还记得吗,是否有过具体的特性或产品选择,是基于你预见到模型将不仅仅是稍微变得更聪明,而是显著变得更聪明而做出的?那是否改变了具体的产品或路线图,最终某种程度上导致了你们的成功?因为你提到,我的意思是,肯定还有十几家同样实力雄厚的公司也在这个领域。
迈克尔·特鲁尔: 所以我们早期做的一个非普遍共识的产品决策,源于对一个更具颠覆性未来的兴奋,那就是不构建扩展程序,而是构建一个编辑器。那在当时对人们来说并不显而易见。是的,这源于一种想法,即所有的编程都将通过这些模型进行。它在未来会看起来截然不同。你将需要控制用户界面。
它也来自于我们所知的一些有趣的轶事。所以我们对构建第一个版本的 GitHub Copilot 的内部运作细节略知一二。整个构建 GitHub Copilot 的故事,据我所知(我没有第一手资料,所以某些细节可能不准确),相当有趣,它始于一个寻找问题的解决方案的阶段,即仅仅是对将 GPT-3 应用并使其对程序员有用感兴趣。我认为这来自于领导层。它来自当时 GitHub 的首席执行官。他只是说,我们需要这样做。他就像是派遣了一个完整的团队去弄清楚……当时是马特·弗里德曼吗?是的,据我所知,这出自马特。
我想他花了近一年的时间在“沙漠”中摸索,尝试了各种不同的产品理念。当然,他们有……这些人对人工智能的未来充满热情。所以他们立刻想到,我们能否在时机未到之前,就稍微自动化一下拉取请求的意图?他们为此努力了一阵,然后断定那是不可能的。他们尝试了所有这些稀奇古怪的产品构想,直到他们最终只做了自动补全这个简单的功能。但即便在他们让自动补全功能正常工作后,他们仍然需要在编辑器层面进行修改。他们无法完全以扩展的形式实现。他们不得不去修改VS Code主代码库中的内容,并暴露不同的编辑器API,才能仅仅显示出那种幽灵文本。然后,根据我的理解,有些事情在组织上其实是相当难以完成的。如果要为像幽灵文本自动补全这样简单的功能修改编辑器,我们就知道将来会有大量类似的工作。
所以那并非显而易见。我们为此招致了很多批评。我们最初实际上是从零开始构建自己的编辑器,显然使用了大量开源技术,但并没有像浏览器基于Chromium那样,以VS Code为基础。这有点更像是从头开始构建浏览器所有的内部渲染。我们就用它发布了,然后我们切换到基于VS Code。但编辑器这件事并非显而易见。
从产品到公司:增长、指标与团队建设
陈嘉兴: 所以,Cursor 问世了。你们做出了一系列结果证明是正确的决策。你们什么时候知道它会成功的?
迈克尔·特鲁尔: 这花了一些时间。如果你还记得,最初有一年左右的时间,大概是一年的“荒野期”,我们一直在研发一个 Cursor 的前身,并且主要是在机械工程方面。之后是 Cursor 的一个相当短的初始开发期,然后我们才向公众发布了第一个版本。我认为,从开始编写代码到首次公开测试版发布,只用了三个月。但在那之后,我们又经历了在非常小的规模上公开迭代的一年,期间我们没有找到那种爆炸性成功的模式。尽管有所增长,但用户数量依然很少。
当时,为了精调产品并把所有细节都处理好,大概花了一年时间。直到Cursor推出后的最初九个月到一年时间,团队持续致力于底层产品的开发和团队的组建,此外,不仅是产品层面,当Cursor开始获得并利用其背后定制模型的第一批版本来提供底层动力时,事情才开始变得水到渠成。然后增长才开始加速。之后,是的,从那时起,我们就有点像是抓住了猛虎的尾巴。如果我们要取得成功,未来还有很多事情需要我们持续推进。我认为我们和许多其他在类似领域的公司面临的挑战之一,就是我们需要建设公司的速度确实非常快。而我认为,关于“人员编制增长不应超过50%”或“逐年”之类的经验法则。
陈嘉兴: 铁律。
迈克尔·特鲁尔: 是啊,我想,它们需要被打破。
陈嘉兴: 有意思。当时是否有一些北极星指标,或者你和你的联合创始人正在监测的事项,以判断这是否奏效?是周环比留存率,还是打开率?或者这如何影响了你们在特定一周的工作内容?
迈克尔·特鲁尔: 我们关注了所有常规指标,比如留存率。对我们来说,我们主要关注的活跃度指标,或者说我们主要关注的顶线指标,是营收。我们关注的付费高阶用户,衡量标准是:你在一周七天中有四到五天在使用这款AI吗?而这个数字正是我们努力提升的目标。为什么要收费?嗯,我认为我们是一个为专业人士服务的工具。而且我认为提供这个工具,它是有真实成本的。所以我们很关注您升级到付费层。那才是事物可持续发展的地方。付费的重度用户,那才是我们关注的,你知道,而不是日活跃用户、月活跃用户或类似的东西。而是,你是否每天都在工作中用到它?那就是我们试图提升的。
陈嘉兴: 那么一旦那成为衡量指标,我想,你们是否从那倒推呢?就像是,嗯,我们知道我们想要发展的目标人群。那么他们想要什么?或者是什么会阻止人们成为那样?
迈克尔·特鲁尔: 我认为,在很多领域,为自己而构建是行不通的。对我们而言,它确实可行。我认为这实际上是澄清了问题,因为构建AI产品时,一个极具诱惑力的误区就是过度优化演示效果。我们非常担心过度优化演示效果,因为对于AI来说,很容易就能拿几个例子拼凑出一个视频,让你看起来好像拥有了一款革命性产品。然后我认为,从能呈现出出色演示效果的版本,到真正有用的AI产品之间,还有很长一段路,需要大量工作,这意味着要精细调整速度、可靠性、智能和产品体验等方面。
对我们来说,我们真正付诸行动的主要一点就是重新加载编辑器。我们早期的产品开发过程非常具有实验性。它非常专注于我们所理解的苹果模式,即非常注重内部测试和可用的演示,比如我们可以在内部编辑器中立即开始使用的东西。然后我们会查看这些指标,以确保我们周复一周、月复一月地朝着正确的方向发展。是的。
陈嘉兴: 所以你之前说过,我的意思是,有时候你必须打破招聘方面的这些铁律。你是何时决定打破它的?我的意思是,你知道,是不是直到达到某个营收目标之前,都只有联合创始人和少数几个人?你是如何考虑油门的?你是轻踩油门了吗?然后,一旦情况明朗,比如你达到了目标,我们就会把油门踩到底。
迈克尔·特鲁尔: 所以很长一段时间里都只有联合创始人。然后是联合创始人以及少数几个人,直到我们达到事情真正步入正轨并蓬勃发展的阶段。
陈嘉兴: 首批雇员都有谁?我的意思是,我猜是更多工程师,但你知道的……
迈克尔·特鲁尔: 所以我们为首批员工的招聘煞费苦心。我认为,如果你想以年为单位快速发展,那么以六个月为单位放慢脚步实际上会非常有帮助。因为如果你真正精准地招募到公司最初的10名员工,他们将在未来助你提速。因为当(你知道的)第N位考虑与你合作的人来到公司,并与团队相处时,他们会直接被这种人才密度所震惊,然后会非常兴奋地想在那里工作。那么他们能帮助你未来更快发展的另一个原因在于,如果有人加入后发现不太合适,这些人会像免疫系统一样对此进行抵御,对吗?他们会是某种程度上维持高标准的守护者。
所以我们在初期招聘速度非常、非常、非常慢。我们之所以能够这样做,部分原因还在于我们拥有一个如此庞大的创始团队,并且所有联合创始人都是技术出身。不过,我们招募到的人才都非常出色,他们如今确实是公司的核心。还有那些跨学科深耕的人,因为我们这家公司需要介于基础模型实验室和普通软件公司之间。模型和产品必须在一个体系下协同运作。因此,我们拥有许多优秀的人才,他们既有产品思维和商业头脑,又曾大规模训练过模型。
陈嘉兴: 所以,通才型的多面手在公司最初的10人阶段确实非常重要。
迈克尔·特鲁尔: 是的。以及快速构建产品。是的。并快速交付生产代码。
陈嘉兴: 如今,我是说,每个人都在努力弄清楚如何应对这种情况,但仅仅因为AI工具过于强大,有时甚至更难判断如何评估优秀的工程师?随着你的产品变得越来越普及,这一点对你来说是否随着时间推移而改变了?你们是否会挑选那些非常擅长使用人工智能工具的人?抑或是,你们仍然坚持传统,认为任何人都可以学会如何使用人工智能工具?
迈克尔·特鲁尔: 因此在面试时,对于我们的首次技术考核,我们实际上仍然不允许面试者使用人工智能,除了自动补全功能。没有人工智能的编程仍然是一个衡量技能、智力和作为程序员你希望团队成员始终具备的素质的绝佳限时测试。但另一个原因是,我们已经雇佣了许多非常优秀的程序员,他们实际上并没有使用人工智能工具的经验。我们也不希望因为这些工具非常有用就让他们处于不公平的劣势。所以我们宁愿雇佣这些人,然后在工作中教他们使用这些工具,并且从他们第一次使用这些工具的初学者思维中挖掘产品洞察。
陈嘉兴: Cursor 现在价值90亿美元。随着团队规模的扩大,你们如何保持那种黑客精神?你现在还写代码吗?
迈克尔·特鲁尔: 我写。是的。这是我们经常思考的问题,因为我认为未来的 Cursor 必须与今天的 Cursor 大相径庭。
首先,我认为可以通过招聘合适的人才来实现这一点。所以我们招聘流程的最后一步是为期两天的现场考察,你来和我们一起完成一个项目。而这发生在初步的技术筛选之后。你在办公室里,就像团队成员一样,和我们一起用餐,一起完成某项工作。然后你在最后进行演示,之后我们向你提问。这旨在考察你对该问题领域的精力、兴奋度和激情。如果你可能只是将其视为一份工作,并且同时向许多科技公司投递简历,那么你通常不太可能非常乐意去做这件事。所以我认为一个重要的方法,就是通过招聘流程引进有热情的人才。
有些大型项目需要人与人之间大量的协调,你需要自上而下的统一步调。我认为我们始终希望成为一个也大力推行自下而上实验的地方。因此,我们确实努力鼓励这一点,既鼓励员工利用业余时间进行尝试,也明确地组建工程师团队,将他们从公司其他部门中独立出来,并给予他们完全的自由,让他们可以随心所欲地进行实验。
护城河与未来展望
陈嘉兴: 因此,我认为所有初创企业乃至所有企业现在都在努力弄清楚的一件事是,面对世界上一些最令人印象深刻和难以置信的模型,真正持久且可用的护城河是什么?你对此有何看法?
迈克尔·特鲁尔: 嗯,我认为我们所处的市场以及其他公司所处的市场,与你过去见过的那些并非企业级软件的市场非常相似。因此,我认为许多企业级软件市场的特点是,其产品所能提供的核心价值存在较低的天花板。而且存在大量的锁定效应。
我们所处的市场有点像90年代末的搜索市场,产品的上限非常高。搜索功能在很长很长一段时间内都可能得到大幅改进。而对我们来说,最终目标是用远胜于编码的方式来取代编码,并实现编码自动化。我认为在这方面,我们还有很长很长的路要走。搜索的一个特点,我认为也是我们市场的一个特点是,分发对于产品的改进非常有帮助。因此,如果你的产品有大量用户,你就能拥有一项规模化业务,并能了解产品在哪些方面出了问题,在哪些方面表现良好。所以在搜索领域,这意味着观察人们点击了什么?他们从什么结果跳出?什么是好的搜索结果?什么是差的搜索结果?这继而为研发提供支持,并帮助他们打造更好的搜索引擎。
对我们而言,就是要观察人们在哪里接受了某些事物?他们在哪里拒绝了某些事物?在那些他们先是接受了某些事物但之后又进行了修正的地方,究竟是怎么回事?我们本可以做得更好吗?我认为这将是未来让产品和底层模型变得更好一个非常非常重要的驱动力。
我认为另一个可以汲取灵感的市场是21世纪初的消费电子产品领域。当时关键在于成功抓住了iPod的契机,接着又抓住了iPhone的契机。而且,我认为ChatGPT时刻就像我们这个时代的iPod或iPhone时刻,如果你比其他人更快地推动前沿,你就能获得巨大的收益。我认为在我们的领域中还存在着几个这样的时刻。这样做很难,但我们确实专注于努力成为那些最快冲向目标的人。
陈嘉兴: 现在是2025年。我觉得我们实际上甚至还处在这个智能时代的开端阶段。这真是一场革命。你知道,你个人现在最兴奋的是什么?
迈克尔·特鲁尔: 我认为这将是一个你的构建能力得到极大提升的十年。无论是那些以此为生的人,还是那些从事这方面工作的人。但我认为它也将对更多的人开放。
陈嘉兴: 生逢其时。感谢你今天与我同行。
迈克尔·特鲁尔: 谢谢。感谢您的邀请。
