内容概要
OpenAI 的联合创始人 Sam Altman 深入探讨了公司的多维愿景,它融合了消费技术、大规模基础设施运营和前沿研究实验室。他详细阐述了像 Sora 这样的项目背后的战略考量,强调了人工智能 (AI) 与社会协同发展的重要性,并展望了 AI 科学家在推动科学进步中的巨大潜力。此外,Altman 还分享了关于 OpenAI 的商业模式、领导力经验、战略合作伙伴关系、AI 的社会影响以及 AI 与能源需求之间关键联系的深刻见解。
目录
-
引言
-
OpenAI 的愿景与基础设施
-
商业模式与垂直整合
-
AGI、Sora 与社会协同进化
-
AI 交互界面的未来
-
AI 科学家与科学进步
-
关于模型能力与进展的反思
-
作为 CEO 的经验与领导力课程
-
战略合作与基础设施扩展
-
监管、安全与社会影响
-
版权、开源与内容创作
-
能源、政策与 AI 的资源需求
-
商业化与用户行为
-
人才争夺战与个人感悟
-
给创始人的建议
引言
我曾以为我们偶然发现了一个巨大的秘密——语言模型的规模化定律 (scaling laws),这感觉像是一次不可思议的胜利。我当时想,我们可能再也不会有这样的好运了。但深度学习 (deep learning) 就像一个不断带来惊喜的奇迹,我们一次又一次地取得突破。
当我们实现推理模型的突破时,我再次觉得,“我们再也无法复制这样的成功了。” 这项技术能如此出色地运作,似乎是那么不可思议。但或许,当你发现一项重大的科学突破时,感觉总是如此。如果它真的足够重大,它就会非常基础,并且会持续发挥作用。
OpenAI 的愿景与基础设施
问: 欢迎来到 A16Z 播客。Sam,您在一次采访中将 OpenAI 描述为四家公司的结合体:一家消费科技公司、一个超大规模的基础设施运营商、一个研究实验室,以及包括硬件设备、应用集成、市场和商业在内的所有新业务。这些布局共同构成了 OpenAI 的愿景吗?
Sam Altman: 是的,不过或许可以看作是三家核心公司。我们希望成为人们的个人 AI 订阅服务。我认为大多数人会拥有一个,有些人可能会有几个。用户会通过我们的第一方消费产品使用它,也会用它登录其他各种服务,未来还可能通过专用设备来使用。你会拥有一个了解你并为你提供巨大帮助的 AI,这就是我们想做的事。
事实证明,为了实现这个目标,我们必须建立大规模的基础设施。但最终的目标和使命是:构建通用人工智能 (AGI) 并使其对人类极其有用。
问: 您认为这些为实现主要目标而建设的基础设施,最终会成为一项独立的业务,还是仅仅服务于个人 AI?
Sam Altman: 感觉未来可能会出现其他的用途,但目前我们还没有明确的计划。它当前的目标就是支持我们想要提供的服务和进行的研究。当然,这个规模确实大到令人畏惧,所以你必须对未来的其他可能性持开放态度。
商业模式与垂直整合
问: 多年前,在 ChatGPT 远未问世时,有人问您 OpenAI 的商业模式是什么,您开玩笑说:“我们会问 AI,它会帮我们想出来。” 现在回想起来,这个玩笑似乎有其真实之处。
Sam Altman: 我们确实有好几次向当时最新的模型询问该怎么做,并且得到了我们未曾想到的、富有洞察力的答案。所以,当我说那样的话时,大家可能没把我们当真,但或许你们应该同时认真地看待这个说法。作为一个组织的管理者,我经常向 AI 咨询我应该做什么,它有时确实能给出非常有趣的答案。
问: 那么,除了获取更多分发渠道和计算资源之外,连接这些不同业务的核心逻辑是什么?
Sam Altman: 研究让我们能创造出卓越的产品,而基础设施则支持我们进行研究。这就像一个垂直整合的堆栈。你可以用 ChatGPT 来获取管理组织的建议,但这背后需要强大的研究成果和庞大的基础设施作为支撑。所以,它们本质上是一件事。
问: 您认为未来这个堆栈会变得完全水平化,还是会在可预见的未来保持垂直整合?
Sam Altman: 我曾经一直反对垂直整合,但现在我认为我可能错了。理论上,我们总希望经济是高效的,每个公司专注于一件事。但在我们的实践中,情况并非如此。OpenAI 的发展历程表明,为了实现使命,我们必须比预想的做得更多。科技史上最成功的产品之一 iPhone,就是一个高度垂直整合的典范。
AGI、Sora 与社会协同进化
问: 在您看来,哪些业务是为了实现 AGI,哪些又是为了对冲不确定性?
Sam Altman: 表面上看,Sora 似乎与 AGI 无关。但我敢打赌,如果我们能构建出非常出色的世界模型 (world models),它对 AGI 的重要性将远超人们的想象。就像当初很多人认为 ChatGPT 与 AGI 关系不大,但它不仅帮助我们构建了更好的模型,理解了社会如何使用这项技术,还推动了整个社会开始认真思考和应对 AI 的到来。
问: 能否详细谈谈 Sora 在您的战略中扮演的角色?有人质疑为什么要把宝贵的 GPU 资源投入到 Sora 上。
Sam Altman: 我坚信,技术与社会必须协同进化 (co-evolve)。你不能等到最后才把一个颠覆性的东西扔给世界,那行不通。世界很快就要面对能够深度伪造 (deep fake) 任何人、或生成任何你想要画面的强大视频模型。这在很大程度上是好事,但社会也需要经历一个适应期。就像 ChatGPT 一样,我们认为世界需要了解视频技术正在迅速走向何方,因为视频比文本更具情感共鸣。
此外,Sora 也能推动我们的研究议程,是通往 AGI 路径上的一环。当然,AI 的发展不应仅仅是为了追求效率和解决问题,也应该带来乐趣和喜悦。我们投入到 Sora 的算力,在绝对数量上很多,但在我们总算力中的占比并不大。
AI 交互界面的未来
问: 您曾说模型已经满足了“聊天”这个使用场景。那么,未来的 AI 人机交互界面会是什么样子?
Sam Altman: 我说“聊天”饱和,是在一个很狭义的层面上,即进行基础的对话。但聊天界面能为你做的事情,还远未达到饱和。比如,你现在还不能对它说“请治愈癌症”。所以,文本交互的形式还有很大的发展空间。
当然,还会有更好的交互界面。Sora 就提供了一种想象:一个界面是实时渲染的、持续变化的视频,这将带来全新的可能性。未来还可能会有新的硬件设备,能时刻感知周围环境,而不是像手机那样随时用通知打扰你。它会真正理解你的情境,在合适的时机向你展示你需要的信息。
AI 科学家与科学进步
问: 未来几年,模型将能做到哪些今天做不到的事情?会是更深层次的白领工作替代,还是 AI 科学家?
Sam Altman: 会有很多,但你提到了我最兴奋的一点:AI 科学家 (AI scientist)。我们今天能坐在这里认真讨论这个话题,本身就很疯狂。
图灵测试 (Turing test) 的大众概念,可以说已经被飞速超越了。我们曾长期视其为 AI 的终极考验,感觉遥不可及,然后突然之间它就被通过了。世界为此震惊了一两周,然后就接受了“好吧,电脑现在能做这个了”的现实。
我认为,科学领域正在发生同样的事情。对我个人而言,衡量标准一直是 AI 能否进行科学发现,那将是对世界的真正改变。在 GPT-5 上,我们第一次看到了一些微小的迹象。你在社交媒体上看到,它做出了一些新颖的数学发现,或是在物理、生物研究中解决了一些小问题。我们看到的所有迹象都表明,这条路会走得更远。
我相信,再过两年,模型将能承担更大部分的科学工作,并做出重要的发现。这将对世界产生重大影响。从根本上说,科学进步是让世界变得更美好的动力。如果我们即将拥有更多的科学进步,那将是一件大事。
关于模型能力与进展的反思
问: 自 ChatGPT 发布以来,AI 领域的发展有哪些让您感到惊讶或更新了您的世界观?
Sam Altman: 也许最有趣的一点是,我们发现了如此多的新东西。我曾以为我们偶然发现了语言模型的规模化定律这个巨大的秘密,感觉像是了不起的胜利,以后再也不会这么幸运了。但深度学习是一个不断创造奇迹的领域,我们一次又一次地取得突破。
现在,模型的能力储备 (capability overhang) 非常巨大。世界上大部分人仍然只了解 ChatGPT 能做什么。然后,硅谷的一些技术爱好者在使用代码模型 (codecs),并感叹普通人对 AI 的理解太浅。而少数顶尖科学家又会觉得,那些使用代码模型的人同样不了解前沿进展。模型的能力已经发展得非常快,也走得非常远了。
问: 那么,基于大型语言模型 (LLM) 的技术还能走多远?在哪个节点我们需要新的架构或新的突破?
Sam Altman: 我认为它能走得足够远,远到可以利用现有技术创造出能发现下一个突破的东西。这是一个自我指涉的答案,但如果基于 LLM 的技术能发展到比整个 OpenAI 的研究能力还要强,那或许就足够了。
作为 CEO 的经验与领导力课程
问: 您最近与 AMD 达成了合作。与早年相比,您作为一名 CEO 的思维方式发生了怎样的变化?
Sam Altman: 早期我几乎没有运营经验。我天生更适合做投资者,也以为那会是我的职业生涯。所以,当时我更多是以一个为公司提供建议的投资者的心态在做事。现在,我理解了真正运营一家公司意味着什么。这些年,我学到了很多关于如何将交易落地、如何进行运营,以及协议背后所有复杂影响的知识,而不仅仅是看到“我们能获得分发渠道和资金”。
问-Ben Horowitz: 看到您从投资者转型为 CEO 并取得成功,这非常罕见。通常这条路是行不通的。
Sam Altman: 我也对这两个角色的巨大差异感到震惊。坦白说,做一个好的投资者和做一个好的 CEO,体验上是“一份好工作”和“一份坏工作”的区别。CEO 的工作琐碎、复杂,充满了组织动态、冲突解决和办公室政治,远不如投资那样在智力上令人兴奋。这大概就是为什么很少有人愿意从一个感觉良好的角色,跳到一个时常感觉糟糕的角色中去。
战略合作与基础设施扩展
问: 最近您与 AMD、Oracle、Nvidia 等公司达成了合作。这些公司既是合作方,也可能是潜在的竞争对手。您如何决定何时合作,何时不合作?
Sam Altman: 我们已经决定,现在是时候进行一次非常激进的基础设施押注了。我对我们未来的研究路线图以及这些模型将创造的经济价值,从未如此充满信心。但要进行如此规模的押注,我们需要整个行业或者说行业的一大部分来支持。这涵盖了从电力到模型分发的整个链条。因此,我们将与非常多的人合作,未来几个月你们会看到更多这样的行动。
问: 谈到规模,感觉在您心中它的上限是无限的。
Sam Altman: 上限肯定是有的,比如全球 GDP 的总量。但这个上限距离我们今天的位置还非常遥远。如果我们对于模型能力未来走向的判断是正确的,那么它所能释放的经济价值也将是极其巨大的。如果我们只有今天的模型,我们不会如此激进地扩张。但我们能够提前一两年看到未来,所以我们敢下这个赌注。
问: 在平衡产品用户增长和前沿研究时,你们如何分配资源?
Sam Altman: 当资源有限时——这种情况一直存在——我们几乎总是优先将 GPU 分配给研究,而不是产品支持。这也是我们为什么要大力建设基础设施的原因之一,这样就不用做这么痛苦的决定。当然,有时比如新功能上线后迅速流行,研究团队会暂时牺牲一些 GPU。但总体上,我们的首要任务是构建 AGI,所以研究优先。
监管、安全与社会影响
问: 您对 AI 治理和安全的看法有何演变?
Sam Altman: 我仍然认为未来会出现一些非常奇怪或可怕的时刻。到目前为止,这项技术还没有造成巨大的、可怕的风险,但这不代表永远不会。同时,让数十亿人与同一个“大脑”对话,本身就可能在社会层面引发一些我们尚未察觉的、不同寻常的变化。
我预计,这项技术会引发一些非常糟糕的事件,就像历史上其他技术(比如火)一样。但我相信,社会最终会为此建立起相应的护栏。
问: 对于监管框架,您最新的想法是什么?
Sam Altman: 我认为大多数监管可能会带来很多负面影响。我最希望看到的是,当模型的能力真正达到远超人类的水平时,对这些——也仅仅是这些——前沿模型进行非常谨慎的安全测试。我不希望监管负担被施加在那些能力较弱、但能创造巨大价值的模型上,那会像欧洲那样完全扼杀创新。
我们必须谨慎,不要因为对一个遥远未来的担忧,而过早地用不成熟的法规束缚住自己。特别是在美国,如果我们在 AI 领域落后,对世界来说将是极其危险的。
版权、开源与内容创作
问: 您如何看待版权问题的演变?
Sam Altman: 我目前的猜测是:社会最终会认定,使用数据进行模型训练属于“合理使用” (fair use)。但同时,会有一种新的模式来规范如何生成带有特定风格或知识产权 (IP) 的内容。就像一个作家可以阅读任何小说来获取灵感,但不能直接复制小说内容一样。
有趣的是,对于 Sora,我们收到了很多权利持有者的担忧,但也收到了同样多的权利持有者表示:“我担心的是你们不够多地使用我的角色。” 他们希望人们能与他们的角色互动,从而提升其 IP 价值。未来很可能会出现一种情况:权利持有者因为我们没有足够频繁地生成他们的角色而感到不满,而不是因为生成得太多。
问: 关于开源模型,您最新的看法是什么?
Sam Altman: 我认为开源是件好事。看到人们喜欢我们的开源模型,我感到非常高兴。当然,这里面也有战略考量。比如,如果某个由特定背景支持的开源模型成为主导,我们需要思考这背后的风险。我们发布一个高质量的开源模型,也是为了给学术界和开发者提供一个可靠的选择,避免他们完全依赖其他来源的模型。
能源、政策与 AI 的资源需求
问: 您说过您在职业上最关心的两件事是 AI 和能源,没想到它们最终会合二为一。
Sam Altman: 是的,这曾是两个独立的兴趣,现在它们真正地融合了。纵观历史,降低能源成本、提供更丰富的能源,一直是提高人们生活质量最有效的方式。所以我认为,进一步推动这一点是个好主意。
问: AI 的发展带来了巨大的能源需求。您如何看待能源政策和技术的发展?
Sam Altman: 我预计短期内,美国新增的能源供应将主要来自天然气,以满足基础负荷。长期来看,我认为两种主导能源将是太阳能加储能,以及核能。这两者的某种组合将在未来胜出,包括先进核能、小型模块化反应堆 (SMRs) 和核聚变。
核能能否快速普及,很大程度上取决于其成本。如果它在经济上相对于其他能源具有压倒性优势,我预计推广速度会很快,因为巨大的经济利益会推动政策制定者迅速采取行动。如果成本相差无几,那么反核情绪可能会占上风,进程会非常缓慢。但它理应成为地球上最便宜的能源形式。
商业化与用户行为
问: 在商业化方面,您最近在思考什么?
Sam Altman: 目前我最关注的是 Sora 的商业模式,因为它刚推出,使用量非常大。我们发现,人们使用它的方式和我们预想的很不一样。除了专业创作,很多人用它来制作关于自己和朋友的有趣 meme,然后在群聊里分享。Sora 视频的生成成本很高,这种高频次的使用场景需要一种完全不同的商业模式。
这验证了 Sora 的一个核心假设:人们其实有强烈的创作欲望,只是过去工具的门槛太高。这是一个非常酷的变化,但确实意味着我们需要为这种海量创作行为设计一种新的商业模式。
问: 您对广告模式怎么看?
Sam Altman: 我持开放态度。像很多人一样,我对广告有些反感,但并非完全排斥。有些广告是有价值的,比如 Instagram 的广告对我来说就是净增值。但 ChatGPT 与用户之间建立了一种高度的信任关系。人们觉得它在努力帮助自己。如果我们破坏了这种信任,比如为了广告费而推荐一个并非最好的产品,这种信任就会消失。所以,那种直接的推荐式广告行不通。但或许存在其他可以良好运作且不损害信任的广告形式,但这需要非常小心地设计。
人才争夺战与个人感悟
问: 2025 年的 AI 人才争夺战非常激烈,但 OpenAI 团队似乎依然稳固。这一年对您来说是怎样的?
Sam Altman: 自从我们创立以来,每一年都筋疲力尽。我记得运营 OpenAI 的头几年是我职业生涯中最快乐的时光,简直难以置信。那时我们只是一个研究实验室,和最聪明的人一起做着创造历史的工作。然后我们发布了 ChatGPT,所有人都来祝贺我,但我心里想的是:“我的生活要被彻底颠覆了。” 事实也确实如此。这差不多三年以来,一直都很疯狂,而且似乎一年比一年更疯狂。但我已经更习惯了,所以感觉上差不多。
问: 除了 OpenAI,您还投资了长寿和能源领域的公司。这是您十年前就有的宏大计划吗?
Sam Altman: 不,我只是想用我的资本去支持我相信的事业。对我来说,这比购买艺术品之类的更有趣,也更有意义。
给创始人的建议
问: 您曾说,投资者常犯的错误是根据过去的成功模式去寻找下一个机会,比如寻找“下一个 Facebook”或“下一个 OpenAI”。但下一个万亿级公司可能看起来完全不同。对于正在聆听的创始人,在一个 AGI 即将实现的世界里,您认为会出现哪些新的机会?
Sam Altman: 我真的不知道。我有一些猜测,但历史告诉我,这种预测总是错的。我对这一点抱有深深的谦卑。如果你只是纸上谈兵,说出的话听起来很聪明,但基本上和别人说的一样。
我知道的唯一方法,就是深入一线,探索想法,与大量的人交谈。我现在没有时间这么做了,我只能专注于一件事。但我认为,如果你是一位投资者或创始人,这恰恰是最重要的问题。你需要通过动手构建、体验技术、与人交流来找到答案。
我一直对投资者支持这类前沿探索的意愿感到失望,尽管这往往是最终被证明行之有效的方式。大多数公司和创始人都只是在追逐当前的热点。我希望人们能尝试去探索更远大的未来。
问: 您的职业生涯似乎一直在追随好奇心,与最聪明的人和最前沿的技术保持紧密联系。
Sam Altman: 是的,但 AI 一直是我想做的事。我大学时就学习 AI,在 AI 实验室工作。当时这个领域完全没有起色,但我从小就是一个 AI 迷。后来,有了足够的 GPU 和数据,一切都豁然开朗。看到这个曾经被学界和投资者都极度看衰的领域迎来今天的局面,感觉非常奇妙。
