内容概要
本期 Lightcone 节目探讨了汉密尔顿·赫尔默(Hamilton Helmer)的“七种力量”(Seven Powers)框架及其在 AI 初创公司中的应用。主持人深入探讨了不同类型的“护城河”(Moats)——即企业的防御性策略——以及它们在当前 AI 环境下的有效性,并结合成功初创公司的具体案例,为创始人何时应该优先构建这些护城河提供了深刻见解。
目录
-
护城河问题
-
七种力量框架
-
何时开始考虑护城河
-
前线部署工程
-
流程的力量
-
占据关键资源
-
转换成本
-
反向定位
-
劳动力替代的现实
-
品牌与速度作为护城河
-
网络经济
-
规模经济
-
最终建议
护城河问题
“护城河”这个概念非常普遍且重要。有趣的是,与 AI 时代之前相比,现在的创业者们更频繁地讨论护城河。在激烈的竞争中,你如何避免被无限的对手淹没?护城河本质上是一种防御机制,但前提是你必须有值得守护的东西。如果你一无所有,那就无需为护城河担忧。
欢迎回到新一期的 Light Cone 节目。今天我们来聊聊护城河(Moats)。你可能会想象野蛮人正在围攻你的城堡,而你的小初创公司面临着无数想要抢走你午餐的竞争对手。在城堡之外,一条护城河能将他们拒之门外。Jared,当你们去大学校园时,发现这并非一个无关紧要的话题,实际上,它甚至阻碍了一些人创立公司。
Jared: 是的,这是我们在最近的奖学金项目中,从许多非常聪明的大学生那里听到的问题。他们不理解,那些新兴的 AI 代理(AI agent)公司,就像我们在这个播客里讨论过的许多公司一样,如何能建立起护城河。
这背后有一种普遍的看法,认为这些公司都只是 ChatGPT 的“套壳”应用,可以被轻易复制。因此,学生们虽然能理解这些公司可以创造一些收入,但看不出它们如何能成长为一家基业长青的企业。但我认为这种看法并不正确。这些企业实际上拥有相当深厚且有趣的护城河,只是它们并不那么显而易见。所以,这是一个值得我们深入探讨的话题。
七种力量框架
在最近的 AI 创业学校后台,我与 Sam Altman 有一段有趣的交流。我们花了很多时间思考“创造人们想要的东西”这类非常简单的准则,这几乎是反商业学院的。然而,“护城河”这个概念却如此普遍和重要。我们都觉得有趣的是,如今最重要的读物之一,恰好是一本商学院的教材——《七种力量》(The Seven Powers)。
所以今天,我们想逐一解读这七种力量:它们分别是什么?有哪些具体的例子?一个刚刚起步的创业者应该如何从我们见过的真实案例中思考这些问题?Diana,你能给我们介绍一下这本书吗?
Diana: 这本书的作者是汉密尔顿·赫尔默(Hamilton Helmer),他曾在斯坦福大学经济学院任教,该书于 2016 年出版,书名为《七种力量:商业战略的基础》。书中的许多案例都来自 2000 年代的互联网公司,比如甲骨文(Oracle)、Facebook 和 Netflix,这些都属于上一代公司。所以我们想对它进行一次更新,看看这些理论在 2025 年的 AI 时代该如何应用。
Jared: 我认为书中使用的术语有点令人困惑。它被称为“七种力量”,但如果直接叫“七种护城河”会更易于理解,因为这才是他真正要讨论的核心。他实际上是在谈论企业可以拥有的七类护城河。书中的例子虽然有些过时,但这个框架本身是永恒的。事实证明,企业可以拥有的护城河种类是有限的,并且不会轻易改变。所以,尽管这些护城河在 AI 代理领域有不同的表现形式,但其基本类别并未改变。
幸运的是,我们生活在一个充满竞争的自由市场中。对于经营者来说,护城河是抵御那些想做同样事情的竞争对手的唯一途径。彼得·蒂尔(Peter Thiel)有句名言:“竞争是为失败者准备的。”这背后的深刻含义是,在无限竞争的环境下,如果没有护城河,你的利润率最终会趋近于零,这意味着你的企业将会消亡。因此,从长远来看,拥有护城河是关乎生存的。
何时开始考虑护城河
Gary,你之前提出了一个很棒的观点,那就是创业者需要在合适的时机考虑护城河。你能谈谈早期创业者应该如何看待这个问题吗?
这也就是为什么我们通常建议大家先去找到一个有真实问题的人,然后解决那个问题。有趣的是,你会发现几乎在任何地方,都存在着可以用软件,特别是用 AI 来解决的痛点,而这些问题目前并未得到解决。这些痛点的数量如此之多,问题如此严重,以至于只要你找到并解决其中一个,就可能创造出一家市值十亿、百亿甚至千亿美元的公司,而机会就摆在眼前。
这才是人们应该做的第一件事:找到一个问题并去解决它。在这个过程中,随着你与客户合作、构建产品、进行工程设计、确定所需数据,你自然会遇到这“七种力量”中的一种或多种。
Jared: 是的,护城河是后天形成的。如果有人因为无法预见一个创业想法的长期护城河就决定放弃,那是非常愚蠢的。
有趣的是,与 AI 时代之前相比,现在的创业者们更频繁地讨论护城河。这背后的主要原因可能是最初关于“ChatGPT 套壳应用”的讨论,以及人们普遍担心自己的产品会被大型模型公司碾压。大家都在思考,当你开发的产品被某个大型实验室发现很有价值并决定自己也做时,你该如何生存?
Diana: 我认为,就像我们之前邀请的 Windsorf 公司的 Varun 所说,在早期阶段,初创公司唯一的护城河就是速度。当你度过了这个阶段,并创造出人们想要的产品后,才需要开始深入思考我们接下来要讨论的这些护城河。
Jared: 我非常赞同 Varun 的观点,即“唯一的护城河是速度”。这虽然不是书中的七种力量之一,但我认为它应该被加进去。
Diana: 这也与 PG 的许多文章观点一致。创业初期的核心原则之一是,尽管像 OpenAI 或 Anthropic 这样的大公司可以构建所有这些功能,比如直接与 Cursor 竞争的编程工具,但像 Cursor 这样的初创公司之所以能在初期胜出,靠的是不懈的执行力。
像 Google 或 Anthropic 这样的大公司,发布一款产品需要经历繁琐的流程,比如产品经理、运营、产品需求文档(PRD)等等,这导致功能迭代的速度要慢得多。而 Cursor 的故事则令人难以置信。当我们邀请 Michael Truell 来分享时,他说他们的产品开发周期和冲刺(sprint)周期只有一天。在 2023 到 2024 年期间,他们每天都在发布新功能。这种速度是任何大公司都无法比拟的。大公司的发布周期通常是几周,甚至可能是几个月或几年。比如,Google 的 Bard 或 Gemini 就花了好几年才推出。
Jared: 我认为 Cursor 和 Windsor 是很好的例子,说明了何时应该开始考虑护城河。在最初的几年里,护城河对他们来说并不重要。他们需要做的只是证明代码生成(codegen)是 AI 的一个极具价值的应用,并且开发环境是至关重要的。在实现了快速增长并达到一定规模后,他们才需要开始思考如何防御来自 Claude Code、Codex 等竞争对手的攻击。
前线部署工程
我一直记得几周前与 Bob McGrew 交流时的一个心智模型。Jared 当时提到,我们可以把这些初创公司看作是大型实验室的“前线部署工程团队”(forward deployed engineering teams)。在早期,由于一切都是全新的领域,我们并不清楚哪些垂直领域和产品最有价值。所以,第一步就是去探索和发现。两年前,我们甚至不确定代码生成或集成开发环境(IDE)是否会成为关键。
一旦你找到了有价值的方向并开始深耕,你就必须预料到竞争会随之而来,因为其他人也会意识到这里的巨大机会。这时,你就需要开始保卫你发现的宝藏了。我们接下来要讨论的除了速度之外的所有护城河,都是关于如何从 1 做到 10 亿、100 亿甚至万亿市值的问题。而最愚蠢的做法,莫过于因为这些理论而放弃了从 0 到 1 的第一步。
Jared: 是的,有些人可能会试图用这个框架来判断两个创业想法哪个更好,因为他们想预测五年后哪个会有更强的护城河,但这完全是行不通的。护城河本质上是防御性的,你必须先有值得防御的东西。如果你一无所有,就别担心护城河了。否则,那就像田野里的一个小水坑,毫无意义。
Diana: 好的,那我们假设有人已经找到了值得守护的有价值的东西,我们来谈谈他们可以考虑建立哪些护城河吧。
流程的力量
Jared: 好的,第一种是“流程的力量”(Process Power)。这个术语听起来有点奇怪,但它基本上意味着你建立了一个非常复杂的业务体系,其中包含了许多他人难以复制的环节。书中的例子是丰田的流水线。
在 AI 领域,我认为这对应的是一个经过多年精心打磨、在真实世界条件下表现出色的复杂 AI 代理。我们在播客中讨论过很多这样的例子,比如 Jake Heller 的 CaseText。还有一些最近的公司,比如向银行销售 AI 代理的 Greenlight(负责 KYC 业务)和 Casa(负责贷款发放)。
这些 AI 代理的有趣之处在于,你可以在一个周末的黑客马拉松上做出一个演示版本。很多大学生想到的就是这种版本,他们会觉得,“这个我一周就能做出来,怎么可能有防御性呢?”但关键在于,黑客马拉松的版本对任何人都没有实际用处。而像 Casa 或 Greenlight 的产品,一旦失败,银行将损失数百万美元,它们是任务关键型(mission-critical)的基础设施,更像是一辆自动驾驶汽车。
Diana: 另一种理解方式是,卓越的工程能力本身就是最强大的流程力量。一个例子是 Plaid。它需要支持的金融机构数量极其庞大,可能有成千上万个不同的网站和爬虫。可以想象 Plaid 的持续集成/持续部署(CI/CD)系统有多复杂。如果我是 Plaid 的负责人,我肯定会使用最新的代码生成工具,以比任何人都快的速度添加新的金融机构。这在现代 AI 时代就是一种深刻的流程力量。
Jared: 我认为这可能是现有 SaaS 公司最主要的防御形式。比如 Stripe、Rippling 或 Gusto,它们的防御性主要来自于它们构建了大量软件,复制这些软件的成本非常高昂。你无法仅仅通过访问它们的网站就复制出后端复杂的逻辑。
这里也存在一种“新手盲点”。用 AI 工具做一个黑客马拉松版本的原型比以往任何时候都快,但要让它在每天数万次的 KYC 请求中稳定可靠地运行,完成最后 10% 的工作,是一种非常繁琐和艰苦的努力,很多工程师对此并不感兴趣。OpenAI 这样的大型模型实验室里的团队也会面临同样的问题。当团队的目标是发明通用人工智能(AGI)时,你很难让他们对打磨 KYC 工具最后 5% 的一致性充满热情。
Diana: 没错,尤其是在像 KYC 这样需要专业知识才能理解边缘案例的垂直领域。
Jared: 如果非要从这七种力量中挑选,我认为速度和流程力量是出现最频繁的两种,它们都与执行力密切相关。
Diana: 这正是那些硬核的建设者们胜出的地方。拥有出色的产品品味和打造最佳产品的能力至关重要。很多人可能有一个误解,认为可以用 20% 的努力构建出 80% 的解决方案,但对于这些产品来说,你需要达到 99% 的准确率,而这往往需要 10 倍甚至 100 倍的努力,这就是帕累托法则(Pareto principle)的体现。
占据关键资源
关于“占据关键资源”(Cornered Resources)这种力量呢?传统的观点认为,这些是令人垂涎的、无法通过市场交易获得的资产。它们本身必须具有独立价值,并且有时能提供远低于市场价的优先使用权。
一个经典的例子是制药公司的专利。获得专利非常困难,需要发明、验证并获得监管批准。专利加上美国食品药品监督管理局(FDA)的批准,构成了一种非常持久的护城河。这种力量如此强大,以至于专利都有有效期限制。
一个更现代的例子是,像 Scale AI 和 Palantir 这样的公司在与美国国防部(DoD)的合作中建立了监管层面的护城河。进入这个领域的过程非常艰辛,你需要雇佣合适的人,花大量时间在华盛顿特区,甚至建立专门的、高成本的“敏感信息隔离设施”(SCIFs)。一旦你成功融入政府体系,你就占据了关键资源,甚至包括政府工作人员的思维空间。现在,如果政府部门想使用 AI,他们必须通过 Palantir 或 Scale,这已经写入了他们的公开文件中。所以,关键资源不一定是钻石矿,也可以是客户头脑中的“钻石矿”。
Jared: 这些例子听起来都像是已经成为超级独角兽(decacorn)的巨头才能做到的。但对于初创公司来说,有一种更贴近现实的关键资源,就是你之前提到的“前线部署工程师”模式。
许多今天非常成功的初创公司正是这样做的。他们通过与客户并肩工作,获得了真实数据和工作流程这种关键资源。这些客户通常无法获得好的软件。初创公司深入了解他们的具体操作流程,比如一封邮件请求如何流转、如何丰富信息、有时甚至需要呼叫中心介入等等。他们将这些看似枯燥的流程,转化为自己的提示(prompts)、评估标准(evals),最终形成自己的数据集来微调模型。这些都是非常有价值的。
例如,Character.AI 利用并微调了大型语言模型(LLMs),将服务成本降低了 10 倍。这本身也是一种关键资源。最好的关键资源就是拥有一个能在特定任务上表现更出色的自研模型。
Diana: 是的。有一段时间,人们认为这是这个领域唯一的护城河,如果你没有自己的模型,你就完蛋了。
Jared: 事实证明这并非事实,它只是众多可能的护城河之一。人们担心的宏观风险是,如果大型实验室某天决定将他们的模型作为一种关键资源并限制访问权限,会发生什么。
有趣的是,尽管一个理想的 AI 系统可能需要大量的预训练、后训练、人类反馈强化学习(RLHF)等复杂技术才能达到 ChatGPT 的水平,但我们仍处于技术革命的早期。即使仅仅通过上下文工程(context engineering)就能达到 80% 或 90% 的效果,也已经足够了。这几乎是初创公司在头两年所需要做的全部工作。Cursor 也不是一开始就对 GPT-5 进行全参数微调,他们只是从“创造人们想要的东西”开始。所以,不要用这些框架过早地否定自己。
转换成本
Diana: 我们要讨论的第三种力量是“转换成本”(Switching Costs)。当你让客户“被困住”时,你就拥有了这种护城河,因为他们更换其他解决方案的成本会非常高。即使新方案可能更好一点,但在财务、运营时间或精力上的转换过程也会非常痛苦。
书中的例子是像甲骨文(Oracle)这样的数据库。当你的所有记录系统和数据都在 Oracle 中时,迁移会变得极其困难。另一个例子是 Salesforce。一旦你所有的客户记录都在 Salesforce 中,并且围绕它建立了各种工作流,重新培训销售团队、迁移所有数据都是巨大的工程。这可能会让公司损失一整年的生产力。
我认为 AI 公司正在通过一种类似“前线部署工程师”的方式来建立这种护城河。例如 Happy Robot 或 Salient,它们为大型企业提供高度定制化的工作流。这个过程可能需要长达六个月到一年的试点期,但一旦成功,就能转化为七位数的合同。
试点期之所以这么长,是因为它们在为这些公司的特定运营构建定制软件。例如,Happy Robot 深入集成了 DHL 的物流运营工作流;Salient 为金融行业构建的 AI 语音代理,也需要与银行各种不同的贷款、债务、欺诈监控流程进行深度整合。因为这些大公司都有自己独特的内部工具和流程。
这种模式的代价是销售周期很长,但回报是巨大的合同。一旦你进入了客户的系统,你就很难被替代。大企业不会轻易地再去做一次选型,因为那对他们来说是巨大的时间浪费。
Jared: 这是一个有趣的矛盾体。转换成本既是一种护城河,同时 AI 也在极大地降低转换成本。这为初创公司提供了新的机会。如果你能用代码生成工具从老旧的、僵化的系统或竞争对手那里提取数据,那么过去依赖高转换成本的护城河就可能被打破。
Gary: 实际上有两种转换成本。一种是 SaaS 时代的传统转换成本,比如 Salesforce 或招聘系统 Lever,其核心在于数据迁移的痛苦。我同意 Jared 的观点,LLMs 可能会显著降低这种成本,因为它们可以帮助转换数据模式,甚至通过浏览器自动化来解决数据导出的问题。
但现在出现了一种新的、AI 时代原生的转换成本,正如 Diana 提到的,那就是通过漫长的 onboarding 过程,实现对代理逻辑而非仅仅是数据的深度定制。这在 SaaS 时代是不存在的。
Diana: 是的。对于面向消费者的 AI 公司来说,虽然还处于早期,但我认为“记忆”已经成为一种转换成本。Claude 在记忆功能上的落后让我很惊讶,而我与 ChatGPT 的关系在过去一年里有了显著的演变,感觉它越来越了解我的兴趣和关心的事情。这种个性化带来的转换成本只会越来越高。
反向定位
关于书中的另一种护城河,“反向定位”(Counter Positioning)呢?它的定义是,采取一种现有巨头难以模仿的策略,因为模仿会损害他们现有的业务。
Jared: 我认为这有几种表现方式。在每个领域,现有的 SaaS 巨头都在开发自己的 AI 代理,而新兴的 AI 原生公司则在这些 SaaS 平台之上构建 AI 代理,两者之间存在着一场达尔文式的竞争。例如,在客户支持领域,Zendesk、Intercom 等老牌公司都在构建自己的 AI 代理,而过去几年也涌现出一批与这些系统接口的新公司。谁会在这场竞争中胜出,是一个非常有趣的话题。
反向定位在这里的一个体现是定价模型。几乎所有老牌 SaaS 公司都按席位(seat),即按员工人数收费。这是一个巨大的战略弱点。因为如果他们的 AI 代理效果很好,公司需要的员工就会减少,这反过来又会减少他们的收入。
我猜测,一些由创始人控制的公司,比如 Intercom,可能会有足够的远见来认识到这是一个关乎生存的问题,并可能主动进行自我颠覆。但对于那些非创始人控制的公司,我不太乐观。颠覆自己的收入来源是非常困难的。
Diana: 另一方面,我们看到很多初创公司的定价模型是围绕“完成的工作”或“完成的任务”来设计的。
Jared: 是的,这不仅改变了定价,也迫使产品必须真正能够完成工作。我常常在 YC 路演结束时给创始人的建议是,希望他们能花一个月时间去那些后期公司看看。我们从那些公司的创始人那里听到的最大抱怨是,他们很难重塑公司的工程文化,让团队真正拥抱 AI,使用新工具,进行上下文工程和提示工程。
结果就是,这些团队无法交付出真正有效的 AI 产品。所以他们既不想放弃按席位收费的模式,因为那是他们习惯的,又无法提供能按效果付费的产品。这让他们陷入了两难。
Gary: 是的,他们在新兴的工程流程上做得不好。一个有趣的现象是,在很多 YC 初创公司中,比如 Aoka,他们做的客户支持软件类似于 ServiceTitan,但专注于暖通空调(HVAC)领域。ServiceTitan 大概只占一个 HVAC 公司总交易额的 1%,因为这些服务业的利润率较低,在软件上的花费不多。
但 Aoka 发现,他们可以先以软件的形式进入,然后逐渐获得更大的钱包份额(wallet share)。因为他们能让 HVAC 公司为客户支持服务付费,这部分开销占公司总支出的 4% 到 10%,远高于软件的 1%。
所以我们可能会发现,新一代的 AI 初创公司实际上会有更大的增长空间和更高的钱包份额。我们可能都低估了垂直领域的 SaaS AI 公司的潜力和规模。
Diana: 这也印证了我们在那一期节目中谈到的,垂直领域的 AI SaaS 代理的市场规模将至少是传统 SaaS 的 10 倍。因为它触及的是公司开支中一个全新的部分,不再是有限的软件预算,而是过去由人力完成的工作流程。
劳动力替代的现实
我知道人们对劳动力替代问题很敏感,但对于 HVAC 服务公司来说,客户支持并不是一份愉快的工作。这些岗位的年流失率高达 50% 到 80%。公司和呼叫中心自己也花了大量时间去招聘新人来填补这些没人愿意做的岗位。
当有了更好的软件后,并不是人们失去了工作,而是他们本来就会因为工作体验差而离职。Aoka 告诉我们,许多以前在客户支持岗位上的人,现在有了更有趣的工作。他们不再是管理一群不情愿的员工,而是管理 AI 代理,并处理那些有趣或棘手的边缘案例。最酷的是,他们有时甚至可以修改提示,直接影响客户体验和自己的日常工作。这比照着脚本念稿子要有趣 10 倍。
Gary: Harj,你之前提到了第二种形式的反向定位。这个领域发展得如此之快,以至于在许多垂直领域,很早就出现了一个被视为早期赢家的公司。但在 YC 的经验中,我们反复看到后发者优势。比如 Stripe 在 Braintree 之后出现,通过打造更好的产品赢得了市场;DoorDash 在 Grubhub、Postmates 之后出现并最终胜出。
所以,如果你进入一个已经有早期赢家的领域,思考如何对他们进行反向定位是很有趣的。一个例子是 Legora 对比 Harvey。两者都在法律 AI 领域,Harvey 是早期赢家。我看到的 Legora 的反向定位是,Harvey 虽然早期进入并获得了一些销售,但他们过于专注于模型微调,而后来证明这可能不是正确的方向。正确的做法是专注于应用层,打造更好的产品体验。Legora 正是这样做的,他们的品牌和定位也因此取得了很好的效果。
另一个例子是我更熟悉的 GigaML,他们进入了客户服务领域,与 Sierra、Deacon 等知名公司竞争。他们的反向定位是,他们的产品开箱即用(out of the box)的效果更好,因此销售和部署流程更快。他们的宣传点是,如果你想尽快让你的客户支持系统运转起来,GigaML 是更好的选择。
Jared: GigaML 是一个很好的例子,说明了 AI 代理不仅能像人类一样完成工作,甚至能做得更好。GigaML 的 AI 代理与 DoorDash 的骑手交流时,很多骑手英语并不流利,他们说各种各样的语言。你不可能雇佣一个精通 200 种语言的客服,但 LLMs 可以,而且它们有无限的耐心。
品牌与速度作为护城河
Diana: 还有一个例子是 AI 产品能够实现超人能力。
Gary: 是的,比如 Duolingo 对比 Speak。Duolingo 是最知名的语言学习应用,但越来越多的人批评它更像一个游戏,而不是一个真正的语言学习工具。而 Speak 利用 LLMs 和语音技术,帮助用户通过练习真正学会一门语言。这种反向定位非常成功,Speak 实现了爆炸性增长。它不是在游戏化机制上与 Duolingo 竞争,而是专注于“通过说来学语言”这个核心价值。
Diana: 我认为反向定位与品牌(Brand)这个护城河非常接近。
Jared: 书中提到,当你变得非常知名,即使有同类产品,消费者仍然会因为品牌效应而选择你。比如可口可乐。在 AI 领域,品牌作为护城河对初创公司来说可能更难建立,因为它需要时间积累。
但我们能看到品牌的力量。让我至今震惊的是,OpenAI 的 ChatGPT 的日活用户比 Google 的 Gemini 要多。任何了解模型的人都会说,Gemini Pro 2.5 和 Gemini Flash 2.5 是同等水平的模型。而且 Google 本身拥有全球几乎所有的用户,而 OpenAI 最初一无所有。Google 已经是全球最大的消费品牌之一,但另一家公司却成功地建立了“消费者 AI 应用”的品牌,让 Google 只能追赶。如果有人在 2022 年告诉我这会发生,我会觉得难以置信。
Diana: 这也是反向定位的一个完美例子。
Gary: Google 的商业模式依赖于广告,这使得它不愿意颠覆自己的现金牛业务,即使这意味着会延迟人类获取知识的进程,而这本是 Google 的核心使命。
Diana: 这里还有 ChatGPT 诞生背后不为人知的故事,这又回到了初创公司最初的护城河——速度。它是由一个小团队在几个月内迅速开发出来的。这背后需要 Sam Altman、YC Research 和 Greg Brockman 从 DeepMind 挖来 Ilia Sutskever 等人才。许多创造 OpenAI 的核心人员都来自 DeepMind,但那个环境并没有催生出社会真正需要的东西。所以,速度,又是第一护城河。
网络经济
你想谈谈“网络经济”(Network Economies)吗,Diana?
Diana: 是的。书中将网络经济描述为:随着更多用户使用产品,产品的价值会随之增加,每个用户都能从中获益。书中的例子是 Facebook,越多的朋友使用,它对我就越有趣。另一个例子是 Visa,越多的商户接受 Visa,消费者在越多地方能刷卡,它的价值就越大。这种护城河很难被打破,因为你需要积累同样庞大的用户或商户网络。
在 AI 时代,网络效应以一种新的形式出现,那就是数据。AI 公司获取的数据越多,他们训练的定制模型就越好,从而为用户提供更好的产品。除了大型基础模型公司,像 Cursor 这样的公司也从中受益。他们在免费版中明确表示会使用用户数据来训练模型。用户越多,他们的数据就越多,比如每一次鼠标点击和键盘输入,都会被用来改进模型,从而形成正向循环。
当 AI 初创公司与企业合作时,它们能接触到私有数据。比如 Salient 或 Happy Robot,随着客户公司的员工使用他们的产品,他们能获得大量私有数据来优化工作流。另一种形式的网络效应来自评估(evals)。我们多次谈到,评估是 AI 初创公司的关键护城河。通过评估工作流是否有效,公司可以不断迭代和改进上下文工程,形成一个只有通过大量使用才能实现的增长飞轮。
规模经济
书中最后一种护城河是“规模经济”(Scale Economies)。Jared,你来介绍一下吧。
Jared: 规模经济是指你投入大量资金建立了一个庞大的系统,从而获得了成本优势,能以比任何人都低的价格提供服务。经典的例子是 UPS、FedEx 或亚马逊的配送网络。
在 AI 世界,这主要体现在模型层,而不是应用层。训练一个顶尖的 LLM 资本密集,只有少数公司能负担。一旦建成,你就可以以很低的成本提供推理服务。去年 DeepMind 的发布之所以震撼,是因为它似乎表明训练一个前沿 LLM 的成本可能比想象中低得多,这会削弱大型 AI 实验室的规模经济护城河。
Diana: DeepMind 的关键在于他们公开了一种新的模型解锁方式,即如何进行强化学习(RL)。但他们仍然是建立在大型基础模型之上的,所以基础模型的成本依然高昂。
Jared: 这是一个关于基础模型公司之间如何竞争的问题。规模经济是他们护城河的一部分。对于初创公司来说,这样的例子不多,但也有一些。比如你的公司 EXA。
Gary: 是的,EXA 本质上是为 AI 代理服务的搜索引擎。它提供 API,让 AI 应用可以搜索网页。为了提供这项服务,他们需要爬取大量网页,这是一项昂贵的固定资本投资。但一旦完成,这个爬取的数据就可以服务于许多不同的客户。
Jared: EXA 有趣的地方在于,他们在 AI 代理真正兴起之前就进行了这项投资,甚至在 ChatGPT 发布之前。他们像大型实验室押注 transformers 一样,提前下了赌注。
Gary: 在最近的一期 YC 训练营中,就有两家公司 Channel 3 和 Orange Slice 在做类似 EXA 的事情,通过爬取大量网页并在此基础上运行代理。我认为随着网页代理的效果越来越好,我们会看到更多这样的公司。
最终建议
你需要关注的第一个护城河,甚至不在书里,那就是速度。如果你还在纠结自己是否能占据关键资源,那你的思路就错了。你应该从一个具体的人和一个具体的痛点开始。这个痛点必须足够强烈,不是“如果能这样就好了”,而是“如果解决不了这个问题,我今年就升不了职,甚至可能被解雇”。
你要找的是那种让客户感到生存焦虑的痛点。如果你能用软件解决这种痛苦,帮助他们的业务免于倒闭,或者实现巨大的增长,那就去做。先从 0 到 1 开始。
那么,下次再见。
