18日,华为全联接大会2025在上海开幕,华为副董事长、轮值董事长徐直军发表题为“以开创的超节点互联技术,引领AI基础设施新范式”的主题演讲,正式发布全球最强算力超节点和集群。
徐直军说,尽管DeepSeek开创的模式可以大幅减少算力需求,但要走向AGI、要走向物理AI,算力将继续是人工智能的关键。
算力的基础是芯片,昇腾芯片是华为AI算力战略的基础。自2018年发布Ascend 310芯片,2019年发布Ascend 910芯片,到2025年,Ascend 910C芯片随着Atlas 900超节点规模部署。
未来3年,至2028年,华为在开发和规划了三个系列,分别是Ascend 950系列,包括两颗芯片:Ascend 950PR和Ascend 950DT,以及Ascend 960、Ascend 970系列,更多具体芯片还在规划中。
徐直军分别介绍快要推出的和已规划的4颗昇腾芯片。
目前正在开发、且即将推出的芯片叫Ascend 950系列。Ascend 950 PR和Ascend 950 DT共用了Ascend 950 Die。与前一代昇腾芯片相比,Ascend 950 在以下几个方面实现了提升,包括新增支持业界标准FP8/MXFP8/MXFP4等低数值精度数据格式,算力分别达到1P和2P,提升训练效率和推理吞吐,并特别支持华为自研的HiF8,在保持FP8的高效的同时,精度非常接近FP16。
此外,把内存访问颗粒度从512字节减少到128字节,内存访问更精细,从而更好地支持了离散且不连续的内存访问。
Ascend 950PR,主要面向推理Prefill阶段和推荐业务场景。这颗芯片将在2026年一季度推出,首先支持的产品形态是标卡和超节点服务器。
相比Ascend 950PR,Ascend 950DT更注重推理Decode阶段和训练场景。由于推理Decode阶段和训练对互联带宽和访存带宽要求高,华为开发了HiZQ 2.0,使内存容量达到144GB,内存访问带宽达到4TB/s。同时把互联带宽提升到了2TB/s。其次,支持了FP8/MXFP8/MXFP4/HiF8数据格式。Ascend 950DT 将在2026年Q4推出。
第三颗是在规划中的芯片Ascend 960,算力、内存访问带宽、内存容量、互联端口数等各种规格上相比Ascend 950翻倍,大幅度提升训练、推理等场景的性能;同时还支持华为自研的HiF4数据格式。它是目前业界最优的4bit精度实现,能进一步提升推理吞吐,并且比业界FP4方案的推理精度更优。
Ascend 960将在2027年四季度推出。
最后一颗是在规划中的Ascend 970,这颗芯片的一些规格还在讨论中。总体方向是,在各项指标上大幅度升级,全面升级训练和推理性能。目前的初步考虑是,相比Ascend 960,Ascend 970的FP4算力、FP8算力、互联带宽要全面翻倍,内存访问带宽至少增加1.5倍。Ascend 970计划在2028年四季度推出。大家届时可以期待它的惊人表现。
徐直军说,将以几乎一年一代算力翻倍的速度,同时围绕更易用,更多数据格式、更高带宽等方向持续演进,持续满足AI算力不断增长的需求。
今年3月份,华为正式推出了Atlas 900超节点,满配支持384卡。由于是超节点,这384颗Ascend 910C芯片,能够像一台计算机一样工作,最大算力可达300 PFLOPS。到目前为止,Atlas 900依然是全球算力最大的超节点。
“可以说,Atlas 900于2025年,开启了华为AI超节点的征程。”徐直军说。
此次会上,第一款产品正式发布,即Atlas 950超节点,基于Ascend 950DT打造。
Atlas 950超节点支持8192张基于Ascend 950DT的昇腾卡,是Atlas 900超节点的20多倍,我们习惯称呼的昇腾卡,每张卡对应一颗Ascend 950DT芯片,8192张昇腾卡等同于8192颗Ascend 950DT芯片。
Atlas 950超节点的上市时间是:2026年四季度。
徐直军说,Atlas 950超节点,至少在未来多年都将保持是全球最强算力的超节点,并且在各项主要能力上都远超业界主要产品。
其中,相比英伟达同样将在明年下半年上市的NVL144,Atlas 950超节点卡的规模是其56.8倍,总算力是其6.7倍,内存容量是其15倍,达到1152TB;互联带宽是其62倍,达到16.3PB/s。即使是与英伟达计划2027年上市的 NVL576相比,Atlas 950超节点在各方面依然是领先的。
当天发布的第二款超节点产品,Atlas 960超节点。基于Ascend 960,Atlas 960超节点最大可支持15488卡。Atlas 960超节点 由176个计算柜,44个互联柜,共220个机柜,占地面积约2200平方米。
Atlas 960超节点的上市时间是:2027年四季度。
2026年Q1,华为将推出Kunpeng 950处理器,包括两个版本,分别是:96核/192线程和192核/384线程;支持通用计算超节点;安全方面新增四层隔离,成为鲲鹏首颗实现机密计算的数据中心处理器。
2028年Q1,鲲鹏处理器将在芯片微架构、先进封装技术等领域持续突破关键技术,将再次推出两个版本,分别是高性能版本,96核/192线程,单核性能提升50%+,主要面向AI host、数据库等场景。以及高密版本,不少于256核/512线程,主要面向虚拟化、容器、大数据、数仓等场景。
当天发布的第三款产品是TaiShan 950超节点,基于Kunpeng 950打造,全球首个通用计算超节点,其最大支持16节点,32个处理器,最大内存48TB,同时支持内存、SSD、DPU池化。
TaiShan 950超节点上市时间是:2026年一季度。
南方+记者 郜小平
订阅后可查看全文(剩余80%)