华为昇腾950白皮书公布:自研144GB高速内存、4倍性能提升

电科技6月11日消息,前几天华为透露昇腾芯片正在以一年一代、算力翻倍的速度演进,全新一代昇腾950DT芯片将于8月份正式上线华为云平台。

昇腾950系列是去年9月份的全连接大会上发布的新一代昇腾平台的首代产品,实际上有昇腾950PR和昇腾950DT两款产品组成,二者使用的处理器核心是一样的,但搭配的内存系统不同,针对的市场也是不同的。

根据华为的说法,昇腾950PR采用的是昇腾950核心+HiBL 1.0内存,主要面向推理Prefill阶段和推荐业务场景,相比高性能、高价格的HBM3e/4e,能够大大降低推理Prefill阶段和推荐业务的投资。

昇腾950DT更注重推理Decode阶段和训练场景,由于推理Decode阶段和训练对互联带宽和访存带宽要求高,华为开发了HiZQ 2.0,使内存容量达到144GB,内存访问带宽达到4TB/s。同时把互联带宽提升到了2TB/s。

华为日前又把昇腾950的架构白皮书公布了,里面有更详细的架构细节,有意思的是昇腾950PR、DT下面还各有一个低容量版本,从当前128GB、144GB减少到了112GB、96GB,但带宽没有降低,应该是考虑到不同场景下的高低配。

具体的架构可以看看这个白皮书的介绍,随着昇腾950DT未来2个月的部署上线,144GB高速内存、4TB/s带宽及MXFP4带来的4倍性能提升有望推动国产大模型进一步提升。

华为昇腾950白皮书公布:自研144GB高速内存、4倍性能提升

昇腾950系列基于华为自研的第三代达芬奇(DaVinci)架构,构建了灵活、多样且强大的AI算力底座。

该架构全面支持 TF32、FP16、BF16、FP8、MXFP8、HiF8、INT8及MXFP4 等多种精度格式,能够精准适配不同场景的模型需求。

通过支持SIMD/SIMT 混合编程模式,并配备大容量L2 Cache 与超高片上访存带宽,昇腾 950能够最大化释放算力潜能,显著提升计算效率。

除卓越的AI算力外,昇腾950还集成了强大的通用计算与多媒体处理能力:

通用CPU:集成华为自研的 Linx816 CPU 核心,支持物理双线程技术,提供强劲的通用逻辑处理能力。

媒体处理:内置DVPP(数字视觉预处理)子系统,提供硬件级的图像预处理、编解码加速能力。

安全引擎:搭载专用安全算法引擎,确保数据处理的全链路安全。

昇腾950具备业界领先的 IO 扩展能力,整芯片集成72 Lane HiLink SerDes,划分为18个X4端口。

每个端口支持最高达 4×112Gbps的HiLink互联速率,使整芯片对外IO带宽峰值达到 2TB/s。

在网络协议栈方面,全面支持URMA、UB Memory、PCIe 5.0及UBoE 等多种先进网络协议,为大规模集群组网提供高吞吐、低延迟的连接保障。

新增精度格式:原生支持HiF8、MXFP8、FP8、MXFP4等前沿低精度格式,完美契合大模型量化需求。

算力跃升:相比上一代BF16精度,昇腾 950 MXFP4 张量浮点峰值算力提升高达4倍。

华为昇腾950白皮书公布:自研144GB高速内存、4倍性能提升

华为昇腾950白皮书公布:自研144GB高速内存、4倍性能提升

华为昇腾950白皮书公布:自研144GB高速内存、4倍性能提升

华为昇腾950白皮书公布:自研144GB高速内存、4倍性能提升

给TA打赏
共{{data.count}}人
人已打赏
CPU电脑

国产光刻胶又一突破:DUV光刻+浸没式ArF打入国内头部晶圆厂

2026-6-11 21:22:00

电脑电脑系统

程序员开挂了 Win11本周补丁修复206个漏洞:23年来规模最大

2026-6-11 22:18:57

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索