当大模型开始往终端设备里塞,芯片厂商的“军备竞赛”也从单纯的跑分,转向了更加务实的“端侧AI算力”比拼。最近,大联大控股旗下的诠鼎集团联合芯片设计公司此芯科技,搞了一场线上研讨会,核心就是推他们那颗号称专为边缘AI打造的SoC——此芯P1。这场技术分享,透露了不少关于端侧AI落地的硬核细节。
简单来说,此芯P1是一颗瞄准百亿级大模型本地化部署的“全能芯”。它采用了台积电6nm工艺,集成了12核Armv9.2 CPU(主频最高3.2GHz)、10核Arm Immortalis-G720 GPU和一颗专用NPU,异构总算力达到了45TOPS。这配置放在PC或是边缘计算设备上,算是相当能打了。关键指标在于,它支持64GB的LPDDR5内存,带宽冲到100GB/s,这为大模型在本地跑起来扫清了内存墙的障碍。视频解码能力则支持8K@60fps,多媒体处理没短板。
研讨会上,此芯科技生态经理陈嘉栋点出了一个趋势:随着端侧模型能力密度飙升、MoE混合专家模型成熟商用,以及AI Agent开始规模化落地,边端AI芯片的算力需求正在经历一个真正的转折点。隐私安全、实时响应和离线可用这些来自消费端和工业端的硬需求,推动着“端云协同、端侧常驻”成为行业共识。在这种背景下,此芯P1打出的牌是“一芯多用”——靠CPU+GPU+NPU三核协同,给百亿级大模型提供一个“开箱即用”的算力底座。

不过芯片硬件只是基础,真正让开发者头疼的是异构编程的繁琐。此芯科技显然也想到了这一点,他们搞了一个叫NeuralOne的AI软件栈,目标是让开发者在调用不同计算单元时,基本感受不到底层的异构存在。AI软件系统技术专家田洋介绍,这套软件栈覆盖了从NPU驱动、编译器工具链到上层应用的全链路支持,兼容TensorFlow、PyTorch、ONNX这些主流框架。更实用的是,他们通过CIX AI ModelHub预编译和优化了超过140个主流模型,覆盖了视觉、语音、大语言模型和多模态任务,确实做到了“拿过来就能用”。
针对AI Agent的落地,此芯科技演示了一个基于Docker的分布式Agentic阵列方案。底层架构是Master-Worker模式:Master节点负责调度,Worker节点负责执行LLM推理和具体任务。这种设计在边缘场景中,保证了系统的高效协同和一定程度的自治。同时,通过xPU能力矩阵,这套方案实现了视觉感知、语音交互、多模态理解和设备控制的全覆盖。整个方案非常强调“本地优先”,结合了本地向量库和外部知识库的RAG技术来增强长期记忆,既保护了用户数据隐私,也提升了实时响应和离线可用的能力。
另一个极具商业想象力的应用场景是AI NAS。此芯科技正试图用此芯P1把异构AI算力深深地植入边缘存储里。借助12核CPU、10核GPU和30TOPS的NPU,配合DDR ECC内存和6盘位磁盘阵列,此芯P1为需要7×24小时不间断运行的AI NAS提供了一个坚固的数据安全与性能基座。软件层面,他们通过了UEFI SystemReady认证,支持Linux内核和ZFS文件系统,做到了固件层面上的多OS无缝适配;同时,基于Debian 12构建的SDK矩阵和开源NAS OS前端,大大降低了AI NAS的开发和用户使用门槛。
研讨会上,多媒体软件专家楼展还展示了四款已经深度适配的应用:Frigate智能监控(实时多路AI分析)、Jellyfin多媒体服务器(多路视频实时转码串流)、CIX智能相册(本地隐私管理快速查找)、CIX语音助手(语音交互联动搜图)。这些应用落地,意味着此芯P1并非停留在PPT上的“期货”,而是已经跑通了实际场景。
展望未来,此芯AI NAS还将围绕“多Agent管理系统”、“本地AI算力拓展”、“对接云端AI算力”和“适配商用AI NAS OS”这四个方向进行迭代,目标是把AI NAS从一个存储设备,进化为一个全能的私人智能助手。
作为这次研讨会的组织方,大联大诠鼎集团的角色也不只是分销商。自2026年起,原品佳、诠鼎、友尚三大集团整合为全新的诠鼎集团,意在深度聚合资源。他们在开发端帮助客户解决技术难题、加速产品上市;在量产端提供精细库存管理与实时交货服务。对于想要抓住边缘AI浪潮,但又苦于供应链和技术整合的开发者或企业来说,这种“芯片+软件+渠道”的打包模式,正在成为一种更高效的选择。

