OpenAI最近的动作是真的多!
一边是Sora 2引发关注,另一边是各种投资合作,几天前的开发者日又发布了一大堆新品。
大家都在问,OpenAI到底要干啥?背后有什么逻辑?
OpenAI CEO 奥特曼最近在a16z的采访中,给出了回应!
左:a16z合伙人Erik Torenberg;右:a16z联合创始人Ben Horowitz
下面是详细解读——
“我以前反对垂直整合,现在发现我错了”
a16z合伙人Erik Torenberg直接问出了大家心里的疑惑:
OpenAI现在是一家集消费技术、基础设施运营、研究实验室于一体的公司,甚至还涉足硬件和应用集成,这是什么考量?
奥特曼表示,核心目标有三个:
OpenAI想成为大家的个人AI订阅服务,为此,他们需要构建海量基础设施,最终目标是构建AGI(通用人工智能)。
而且当被问到基础设施是否会对外出售时,奥特曼表示目前只支持内部使用和对外提供服务,未来则不好说。
未来可能会有其他利用方式,但目前没计划。
Erik还提到,早年间被问及商业模式时,奥特曼曾玩笑般地说“我们会问AI,它会解决的”。
虽然当时这听起来像玩笑,但后续AI能力进化有目共睹。现在, 奥特曼也会经常问AI一些关于组织运营的问题。
他再次强调了基础设施和研究的紧密关系:
研究让OpenAI能够做出出色的产品,而基础设施让OpenAI能够进行研究,这是一个垂直堆栈。
奥特曼说,过去他一直反对垂直整合,但现在认为自己错了。经济理论推崇公司只做一件事,但OpenAI为了实现使命,必须做更多的事情。
他还提到了iPhone的例子,认为它是科技行业最令人赞叹的产品,并指出它是极其垂直整合的。
为什么把宝贵的GPU投入到Sora上?
话题来到了最近风头正劲的Sora。
Sora虽然好玩,但有人质疑:为什么要把宝贵的GPU资源投入到Sora上?
奥特曼回应说,Sora表面上看似与AGI无关,但他认为,如果他们能建立“真正出色的世界模型”,这对AGI至关重要。
就像当初人们认为ChatGPT与AGI关联不大一样,但实际上,ChatGPT出现后,人们不再直接否定AGI的可能性,这对启发思考很重要。
社会和技术必须共同进步,不能等到最后才把东西拿出来。
总的来说,奥特曼给出了以下几点理由:
做出优秀的产品很酷,人们喜欢Sora;
为了共同进步,让社会“尝到即将发生的事情的味道”很重要;
世界很快就必须应对强大的视频模型,社会需要适应;
让世界了解视频发展方向很重要,因为视频比文字更能引发情感共鸣;
Sora将帮助OpenAI推进AGI研究;
并非所有事情都只关注效率,过程中也需要乐趣和喜悦。
奥特曼也透露,投给Sora的计算资源只占一小部分。
另外,Sora 2发布后,国内外社交网络上出现了大量以生成奥特曼为主角的视频。
奥特曼专门发帖回应,言语中带着一丝无奈。
“图灵测试的等价物是AI科学家”
谈到视频模型,Erik问道:
你8月份曾说模型已经饱和了聊天用例,那么未来的交互界面会是什么样?
奥特曼首先澄清,他当时是在非常狭隘的意义上谈论聊天问题。
也就是说,如果你只想进行基本的聊天,那现在的模型已经足够好;但聊天界面能为你做什么,还远未饱和。
他设想,未来的界面包括:一是像Sora那样实时渲染视频的世界模型;二是新型的环境感知硬件设备,它能理解上下文,并在合适的时候向用户展示信息。
当被问到“未来几年内,模型将能够做到今天做不到的什么? ”时,奥特曼表示自己最看好“AI科学家”。
他认为,图灵测试已经过时。他个人认为,图灵测试的等价物是“当AI能做科学研究时”。就像他们在GPT-5上看到的正在发生的小例子。
他预测,两年内,模型将承担更多的科学工作,并做出重要的发现。
奥特曼说,他现在最大的惊讶是“发现了多少新东西”。
他曾以为,发现Scaling Law之后不会再这么幸运了,但深度学习是一个不断带来奇迹的技术。
当我们获得推理模型的突破时,我也以为我们再也不会有那样的突破了。这项技术如此出色地运作,简直不可思议。
但这也许就是当你发现一个重大科学突破时的感受。如果它非常大,它就是基础性的,而且会持续有效。
至于我们能用LLM走多远?奥特曼自信地说,我们能够用当前的技术“制造出能够找出下一个突破的东西”。
奥特曼还承认,他们最初认为数十亿人都想和同一个AI对话的想法“非常天真”。
他表示,个性化才是最终答案。理想情况下,AI会通过与用户的简短交流来了解他们的喜好并自行推断。但在短期内,用户可能只需要选择一个预设的个性。
“是时候进行非常激进的基础设施押注了”
接下来,奥特曼回应了OpenAI最近与英伟达、AMD和Oracle等公司的合作。
他说,“我们决定是时候进行一次非常激进的基础设施押注了”。他对摆在面前的研究路线图,以及使用这些模型将带来的经济价值“从未如此自信”。
基于这种信心,他意识到OpenAI需要整个行业,或者行业佼佼者的支持。这涉及到从电子级别到模型分发以及介于两者之间的所有事情。
所以我们将与很多人合作,并且大家应该期待OpenAI在未来几个月内有更多的动作。
主持人随即问到了规模扩展上限的问题。
奥特曼冷静下来,承认“限制肯定是有的”,但如果他们对模型能力发展的预测是正确的,那么限制“离我们今天所处的位置还非常遥远”。
他还说,即使只有今天的模型,他们也会扩大规模,但“如果只有今天的模型,我们不会如此激进”。
另外,当被问及OpenAI如何在产品和研究之间分配资源时,奥特曼表示:
当存在资源限制时(这经常发生),我们几乎总是优先将GPU提供给研究而不是支持产品。
基于构建AGI这一终极目标,研究总是最优先的。
“我天生就不是一个适合管理公司的人”
最后,在采访的不同阶段,奥特曼还提到了自己与AI的关系。
他表示,自己从小就是个“AI迷”,AI一直是他想做的事情。
大学一二年级时,他曾在AI实验室工作,学习了物理学和计算机科学。不过当时,AI在外界看来还是个“完全行不通”的东西。
最初OpenAI团队开始研究深度学习和Scaling Law时,整个领域和投资者都“非常讨厌它”,认为这不是一个有吸引力的解决方案。
他还谈到了自己从投资者(曾任YC总裁)到CEO的角色转变。
他坦言自己“天生就不是一个适合管理公司的人”,相比管理公司,他更适合做投资者。
在他看来,投资者擅长知识刺激,通常是一种“好感觉”;而运营公司需要处理组织动态、冲突解决以及各种细节工作,通常是一种“坏感觉”。
他说,早期管理OpenAI时,自己的“实际运营经验非常少”。他甚至开玩笑说,“我简直不敢相信我还在经营这家公司”。
但他觉得那是他职业生涯中“最有趣的几年”,他得以观看顶尖人才进行“惊人的历史性工作”。
最后,奥特曼还提到了能源和开源的话题:
能源是AI最大的瓶颈之一,历史上更便宜、更充足的能源是提高人类生活质量最有影响力的事情;
批评西方长期排斥核能是“一个令人难以置信的愚蠢决定”,核能的推广速度取决于它是否具有完全压倒性的经济优势;
开源是好的,但担忧像DeepSeek这样的中国开源模型主导市场会带来一定风险;
AGI的到来是连续性的,而非奇点大爆炸。
有网友评论说,未来AI之战还是要落脚到能源上。
你怎么看奥特曼的这些观点?