近日,一款名为 DeepSeek 的中国人工智能聊天机器人已经在美国等多个国家的Apple App Store免费排行榜上夺得第一名,这引发了关于硅谷在人工智能发展领域领导地位的质疑。
这款于上周发布的 iOS应用,因其在性能上匹敌或超越如ChatGPT等领先的人工智能模型而受到关注,且其开发成本仅为同行的一小部分,根据周一发布的一项研究 论文显示。
DeepSeek并未从外部资金中筹集资金,也没有采取重大措施来实现盈利。这家人工智能初创公司由对冲基金经理梁文峰创办,他声称仅用2048个Nvidia H800和560万美元的投入,就训练出了一个包含6710亿参数的模型,远低于OpenAI和谷歌用于训练同类模型的开支。例如,微软和Meta仅在今年就承诺每家投入超过650亿美元,主要用于人工智能基础设施。就在上周,OpenAI还宣布与日本的软银创建合资企业Stargate,计划在美国投入至少1000亿美元用于人工智能基础设施建设。
投资者Marc Andreessen已经称赞DeepSeek为“最惊人和卓越的突破之一”,强调其在处理用户的书面查询或提示时能够展示其工作过程和推理能力。DeepSeek还采取了开源的方式,允许开发者自由检查和基于其技术构建应用。
值得注意的是,DeepSeek在美国对先进AI芯片对中国的出口限制下仍然取得了这一突破。公司的成功表明,中国的开发者找到了一种在有限的计算资源条件下创建更高效人工智能模型的方法,这可能挑战了对尖端人工智能开发需要巨大计算基础设施投资的假设。
DeepSeek的出现已在硅谷引发了一场辩论。一些人认为这对美国的技术领导地位构成了担忧,而另一些人,例如Y Combinator首席执行官Garry Tan,则表示这可能会使整个人工智能行业受益,通过降低模型训练的门槛,加速实际应用的发展。
这款应用的成功已对金融市场产生了影响,一些与人工智能相关的股票出现了波动,投资者开始重新考虑人工智能开发所需的庞大资本支出。例如,受到DeepSeek受欢迎消息的影响,Nvidia的股票在周一盘前交易中下滑了10%。