企业想抓住AI的浪潮,第一步往往就卡在了算力上。自建数据中心老旧过时,采购和管理五花八门的计算硬件又令人头疼,这几乎是所有传统企业在智能化转型路上的共同痛点。
12月8日,联想在北京给出了一套名为“联想AI工厂”的综合性答案。这并非单一产品的发布,而是一次旨在将企业数据中心彻底改造为智能化生产线的战略升级。
这套方案的核心引擎是全新升级的联想万全异构智算平台4.0。官方数据显示,其在大模型从预训练、调试优化到最终推理落地的全流程中均实现了性能突破,尤其在部分训练场景下,能将训练时间最高缩短50%。对于动辄耗费数周甚至数月的大模型训练而言,这无疑能直接转化为真金白银的效率提升和成本节约。
更值得关注的是其在“融合”与“易用”上的努力。该平台声称实现了对CPU、GPU等异构计算资源的统一抽象与智能调度,让训练和推理任务能够共享资源并无缝切换。这意味着企业可以更灵活地分配算力,避免昂贵的AI加速器在非训练时段闲置,提升了整体资源利用率。
在网络层面,联想通过集成在网计算技术和自研的RoCE网络自动化调优系统,试图解决高性能计算中令人棘手的网络延迟和拥塞问题,并打出了高性能网络“开箱即用”的口号,意在降低企业部署高性能集群的技术门槛。
此外,针对AI模型实际部署中的推理性能瓶颈,联想展示了其自研推理引擎的优化能力,通过PD分离架构和KV-Cache等技术,在复杂模型上实现了吞吐量与响应时间的提升,以满足严格的服务等级协议要求。
硬件方面,联想也推出了新一代AI服务器——基于英特尔至强6处理器的问天WA8080a G5,为大模型训练提供底层支撑。
此次发布的更深层意义在于,联想联合产业伙伴试图为高性能训练与推理确立一套统一的算力服务质量衡量标准。这步棋如果走通,将有助于规范当前略显混乱的行业指标,推动整个算力基础设施产业向更体系化、高可靠的方向演进,最终加速产业的整体升级。对于身处AI竞赛中的企业来说,一个更稳定、高效且易于管理的算力底座,正是他们眼下最急需的“本地引擎”。
