华为发布AI推理技术UCM：降低HBM依赖，计划9月开源

万能的Siri • 2025年8月13日上午8:26 • IT • 6574 views

AiSiri网8月13日消息，据媒体报道，在2025金融AI推理应用落地与发展论坛上，华为重磅发布了其AI推理创新技术——UCM（推理记忆数据管理器）。这项技术被业内视为有望重塑国内AI推理格局的关键突破，说白了，就是试图在狂飙的AI赛道上，给算力焦虑的玩家们送上一颗“定心丸”。

UCM技术，华为说是通过先进的KV Cache系统，融合多种缓存加速算法工具与精细的分级管理策略，来搞定推理过程中海量的记忆数据。简单翻译一下：这意味着有效扩大上下文窗口，确保推理过程的高吞吐量与低延迟，并显著降低每个Token的推理成本。 这年头，谁不想让AI更快、更便宜呢？

更重要的是，这玩意儿据称能缓解当下HBM（高带宽内存）资源紧缺的问题，让AI应用跑得更流畅，减少对HBM的过度依赖。要知道，HBM现在可是稀缺资源，谁能摆脱对它的依赖，谁就能在成本和效率上占据优势。当然，真实效果还得等市场检验。

此次论坛不仅是UCM技术的首秀，华为还拉上了中国银联，共同发布了双方在AI推理领域的最新应用成果。此外，信通院、清华大学、科大讯飞等机构的专家也来站台，分享他们在大模型推理速度和用户体验优化上的经验。感觉华为这次想搞个大新闻。

华为数据存储产品线副总裁樊杰表示，高质量行业数据和高性能存储对AI发展至关重要。高性能AI存储系统能把数据加载时间从几小时压缩到几分钟，甚至让算力集群的效率直接翻倍。 这意味着什么？意味着训练AI模型的时间大大缩短，也意味着企业能更快地推出新应用。时间就是金钱，效率就是生命，这话没毛病。

最后，华为宣布将在2025年9月正式开源UCM技术，首发平台是魔擎社区。后续还会逐步贡献给业界主流的推理引擎社区，并向采用 “共享一切”(Share Everything) 架构的存储厂商及生态伙伴开放共享。开源，这步棋走得很大。既能吸引更多开发者参与，也能加速技术的普及。至于效果如何，咱们拭目以待。

免责声明：本网站内容主要来自原创、合作伙伴供稿和第三方自媒体作者投稿，凡在本网站出现的信息，均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏，概不负任何法律责任。任何单位或个人认为本网站中的网页或链接内容可能涉嫌侵犯其知识产权或存在不实内容时，可联系本站进行二次审核删除：fireflyrqh@163.com。

华为发布AI推理技术UCM：降低HBM依赖，计划9月开源

关于作者

万能的Siri媒体

华为发布AI推理技术UCM：降低HBM依赖，计划9月开源

关于作者

万能的Siri媒体

相关推荐