华为自研盘古大模型,迭代升级!
在HDC 2024上,华为直接发布了盘古大模型5.0,跳过了4.0版本。
最新系列涵盖十亿、百亿、千亿、万亿四种规模,分别针对当下大模型领域的不同应用需求,并强调了多模态和强思维两方面属性。
盘古5.0有多强大?
华为在发布会上直接演示了搭载盘古大模型的人形机器人。
该机器人可以从多个物体中识别出可饮用的水,并递给口渴的人类。
据介绍,盘古大模型能够帮助机器人完成超过10步的复杂任务规划。
此外,盘古大模型还能生成机器人所需的训练视频,使其能够更快速地学习各种复杂场景。
类似的思路也被应用于自动驾驶领域。
盘古大模型能够理解并遵循物理规律,生成视觉效果逼真、车辆行为真实、环境互动自然的训练视频。
例如,让盘古大模型生成在傍晚下雨行车场景时,它在学习过程中自动理解了“开车灯”这一行为,并在生成视频中模拟了该细节。
最新版本的盘古也被应用于鸿蒙系统,华为智慧助手小艺的多模态能力就受益于盘古大模型。
除了展示能力,华为还在现场揭秘了盘古大模型背后的技术细节,从数据到训练方法都进行了更深入的说明。
当然,发布会还包括原生鸿蒙的一系列最新进展,从架构到生态,都是“有史以来最大升级”。
普通用户(P70、Mate60等)最早将于今年8月体验到Beta版本。
盘古5.0三大升级
盘古5.0主要包含4种参数规格:
十亿级的Pangu E系列:支持手机、PC等端侧的智能应用;
百亿级的Pangu P系列:适用于低时延、低成本的推理场景;
千亿级的Pangu U系列:适用于处理复杂任务,可以成为企业通用大模型的底座;
万亿级的Pangu S系列:处理跨领域多任务的超级大模型。
盘古大模型5.0强调的两大能力为:
多模态
强思维
在多模态方面,盘古大模型5.0能够更准确地理解物理世界,涵盖文本、图片、视频、雷达、红外、遥感等更多模态。
例如,它能够从清明上河图中精准找到“赵太丞家有几口人”。在原画中,这部分的占比不到1/200.
在生成方面,盘古5.0可以生成符合物理世界规律的多模态内容,让创新更加自由。
得益于可控时空生成技术(STCG),模型具有对物理规律的理解能力。
在自动驾驶方面,盘古大模型可以生成六摄像头视角视频,并对细节进行精准控制,使自动驾驶系统能够直接获取全方位、高仿真度的训练素材。
例如,车辆在不同摄像头视角间的平滑过渡,以及在不同天气和光照条件下行驶的自然表现,都体现了模型对空间和时间维度的精准把握能力。
在强思维方面,复杂的逻辑推理是大模型成为行业助手的关键。盘古大模型5.0将思维链技术与策略搜索技术深度结合,显著提升了数学能力和复杂任务规划能力。
例如,在具身智能领域,盘古大模型与乐聚人形机器人合作,使夸父机器人能够识别物品、问答互动、击掌、递水。
通过模仿学习策略,华为云与乐聚公司显著提升了人形机器人的双臂操作能力,实现了软硬件层面的协同优化,不仅增强了机器人综合性能,还克服了小样本数据训练的局限性,推动了泛化操作能力的边界。
多模态和强思维的结合,让盘古大模型在行业的应用更加广泛。
例如在工业设计领域,盘古大模型可用于汽车造型设计、工装设计、模具设计;在建筑设计领域,借助盘古大模型的可控生成能力,只需输入黑白草图,即可生成彩色并带有纹理的建筑群360°实景视频。基于盘古的3D重建能力,还可以构建出高真实感的建筑3D模型,将复杂建筑群的概念设计周期从数周缩短至数十分钟。
除了实际应用,华为还对盘古背后的技术进行了更深入的揭秘。
包括数据科学、新型架构π以及如何训练万亿稠密大模型等方面,都有了更进一步的说明。
鸿蒙系统冲刺,仓颉编程语言正式亮相
除了盘古大模型,这届HDC上的另一件大事是HarmonyOS NEXT的发布。
这一版本被称作是“有史以来最大一次升级”。
HarmonyOS NEXT已正式开启面向开发者和先锋用户的beta升级。
根据官方计划,今年8月P70、Mate60等机型也将开始beta升级。
余承东在现场宣布,鸿蒙原生应用已进入全面冲刺阶段, 5000多个常用应用已全部启动开发,其中超过1500家已完成上架。
据介绍,HarmonyOS NEXT采用端云垂直整合的全新系统架构,从操作系统内核、文件系统,到编程语言、编译器/运行时、编程框架,再到设计系统、集成开发环境,以及AI框架和大模型等,进行了全面革新。
鸿蒙内核完全替代传统内核,性能提升10%;华为研发了EROFS文件系统,随机读性能对比EXT4提升3倍,为用户节省了2GB以上的存储空间。ArkData全新分布式智能数据底座,将华为高斯数据库带到了端侧,拥有多模态、更智能、高性能等特性。
在系统架构上,华为实现了软硬芯云的深度整合,HarmonyOS NEXT的整机性能相比HarmonyOS 4提升了30%。
值得一提的是,华为自研的仓颉编程语言正式亮相,这意味着鸿蒙生态补齐了“最后一环”。
2020年,华为被曝出正在自研仓颉编程语言,并在当年8月申请注册了“仓颉语言”商标。
官方介绍中提到,仓颉编程语言面向全场景应用开发。它是一门多范式编程语言,支持函数式、命令式和面向对象等多种范式,包括值类型、类和接口、泛型、代数数据类型、模式匹配、以及高阶函数等特性。
目前,HarmonyOS NEXT 仓颉语言开发者预览版Beta招募已开启。
发布会上,余承东表示原生鸿蒙正在全力冲刺,加入鸿蒙正当时。
鸿蒙实现了操作系统技术的全面突破,实现中国自主可控!
华为用了10年时间完成了欧美30年才完成的事。
余承东的这番激动人心的发言再次将他送上了热搜。
尽管有人发现“小而美”似乎还没有在鸿蒙生态中得到充分体现,但可以肯定的是,今年鸿蒙系统还将带来更多惊喜。