硅谷的“显卡之王”,如今另辟蹊径,把手伸向了游戏世界的“通用驾照”。
近日,NVIDIA研究团队重磅开源了其全新基础模型——NitroGen。与过往那些专精于下棋或打Dota的“特长生”AI不同,NitroGen的目标宏大而有趣:它要成为一个能“玩转”上千款不同游戏的通用型选手。
从《巫师3》的剑与魔法,到《赛博朋克2077》的霓虹都市,横跨RPG、赛车、吃鸡乃至2D/3D等多种形态,超过1000款游戏构成了它的训练场。但NVIDIA的野心显然不止于培养一个“游戏高手”。
这项研究的真正核心,是探索一种全新的“具身智能”训练范式。简单来说,它试图让AI在光怪陆离的虚拟世界中,学会一套能适应不同“物理规则”的基础运动控制能力。一个有趣的发现是,团队最初为机器人设计的GR00T N1.5模型,在几乎未经修改的情况下,就能在各种机制迥异的游戏任务中展现出惊人的适应力。这仿佛暗示着,在虚拟与真实之间,存在某种智能运动的“通用语法”。
为了构建这套语法,NVIDIA投入了扎实的“基建”。NitroGen项目包含一个超过4万小时的高质量公开视频游戏数据集,其中涵盖了800多款游戏,每款数据时长均超过1小时,更有15款游戏的数据储备达到千小时级别。这些海量、多样化的数据,是模型能够“见多识广”的关键。
此外,项目还提供了一个能力强大的连续运动控制基础模型,以及一套名为Gym API的工具——后者可以将任何游戏程序封装起来进行模型训练和测试。这意味着,理论上开发者可以将其适配到更多、甚至未来的游戏环境中。
最值得关注的是,NVIDIA此次选择了“全栈开源”。从预训练权重、完整的动作数据集,到训练与推理代码,乃至一份技术细节详尽的白皮书,全部公开。这不仅仅是释放一个模型,更是为学术界和工业界提供了一套完整的研究平台与基准。
在AGI(通用人工智能)的道路上,封闭的“绝艺”和开放的“通用基础”是两条截然不同的路径。NitroGen的诞生,标志着NVIDIA正试图用游戏这一充满变化与复杂性的沙盒,为更普适的智能体训练解开第一道工序。它或许不是最强的“游戏AI”,但它想成为的,是未来所有在虚拟与现实世界中行动的智能体的“启蒙教练”。


