老黄宣布 Vera Rubin超级芯片!算力狂飙3倍,锁定美国核武实行室

摘要

当地韶光 10 月 28 日,在英伟达秋季 GTC 大年夜 会上,英伟达首席实行官黄仁勋展现 了最新的 Vera Rubin 超级盘算平台,英伟达直呼其为“超级芯片(Superchip)”。图 | 黄仁勋展现 最新的 Vera Rubin 样品(泉源:英

当地韶光 10 月 28 日,在英伟达秋季 GTC 大年夜 会上,英伟达首席实行官黄仁勋展现 了最新的 Vera Rubin 超级盘算平台,英伟达直呼其为“超级芯片(Superchip)”。

图 | 黄仁勋展现 最新的 Vera Rubin 样品(泉源:英伟达)

Vera Rubin,这一名称来自著名天文学家薇拉·鲁宾(Vera Rubin),象征着对摸索 宇宙与科学前沿的致敬。

该平台由全新的 Vera CPU 与 Rubin GPU 共同组成,目标是同时支撑人工智能大年夜 模型训练、科学盘算与国度 级超级盘算使命。

首批系统将部署在美国洛斯阿拉莫斯国度 实行室(Los Alamos National Laboratory,LANL),并由惠普企业(HPE)帮忙英伟达构建两台新一代超级盘算机“Mission”和“Vision”,分别用于国度 安全 和开放科研使命。

Vera Rubin 的亮相颇具计谋 意味。英伟达的老对手 AMD 刚刚 博得 美国能源部的 10 亿美元超算条约,在高性能 盘算市场中给英伟达带来了不小的压力。

从架构层面看,Vera Rubin 是英伟达迄今最庞杂 的盘算平台,由 Vera CPU 和 Rubin GPU 组成,分为寻常版 Vera Rubin NVL144 和 Ultra 版 NVL576。

Vera Rubin NVL144 平台将采用两颗全新芯片。Rubin GPU 将采用两颗 Reticle 大年夜 小的芯片,FP4 性能 高达 50 PFLOP,并配备 288 GB 的下一代 HBM4 显存。此外,NVL144 平台还将搭载一颗 88 核 Vera CPU,该 CPU 采用定制的 ARM 架构,拥有 176 个线程,以及高达 1.8 TB/s 的 NVLINK-C2C 互连。

(泉源:资料图)

性能 扩大 方面,NVL144 平台将具有 3.6 Exaflops 的 FP4 推理算力和 1.2 Exaflops 的 FP8 训练算力,比 GB300 NVL72 提升 3.3 倍,13 TB/s 的 HBM4 内存和 75 TB 的快速内存,比 GB300 提升 60%,而且 NVLINK 和 CX9 功能的额定速度分别到达了 260 TB/s 和 28.8 TB/s。

NVL144 主要面向 AI 模型的极大年夜 规模训练与及时推理,预计将在 2026 下半年问世。更高端的 NVL576 平台预计将在 2027 年推出,其 FP4 推理性能 将到达 15 Exaflops 级别,FP8 训练性能 达 5 Exaflops。

(泉源:资料图)

黄仁勋表示,Rubin 平台“并非单纯 为AI 筹划,而是兼顾了科研与 AI 的双重担 务”。因此,它并未为低精度AI 性能 牺牲传统高性能 盘算本领,仍旧支撑 高精度 FP64 科学盘算,确保物理模拟、天气模型、量子化学等科研使命能够获得充实性能 。

洛斯阿拉莫斯实行室的Vision 系统将率先部署 Vera Rubin 架构,用于开放科学研讨 与 AI 模型开辟;Mission 系统则面向国度 核安全 使命,筹划在 2027 年正式上线。按筹划,Vision 的性能 将至少比其前代系统 Venado(约 98.5 PFLOPS FP64)提升一倍以上。

英伟达指出,AI 模型规模的敏捷增长 ,正在迫使盘算平台在内存带宽、互连速度 与能效比上取得平衡。

图 | 英伟达门路图(泉源:英伟达)

Rubin 平台支撑 NVLink Gen6 与 CX9 网络,可在节点间供给 260 TB/s 与 28.8 TB/s 的总带宽,使数千 GPU 能以接近单机的延迟举办 协同盘算。这一特性 对训练超大年夜 规模多模态模型尤为关键。

不过,英伟达尚未公布完备的Vera Rubin 系统功耗、散热方案与软件栈兼容细节,尤其是在与 CUDA、HPC SDK、OpenACC 以及科学模拟软件的适配层面。Vera CPU 的微架构信息同样有限,外界推想 其或基于 Grace 的进化版本,但尚未确认。

会上,英伟达还推出一种名为NVQLink 的互连技能,黄仁勋将其称为是“毗连量子和经典超级盘算机的罗塞塔石碑”,它将量子和传统超级盘算机整合成了一个同一、连贯的系统,标记着量子 GPU 盘算时代 的到来。

(泉源:资料图)

NVQLink 将量子处理器和掌握 硬件系统的多种方法直接毗连到 AI 超级盘算机上,能够资助量子从业人员 克服 在扩大 硬件时所面临的集成难题。作为一种开放系统架构,它可以将 GPU 盘算与量子处理器举办 紧密结合,从而为量子超级盘算机带来加速。

据了解,量子比特是一种让量子盘算性能以寻常盘算机无法做到的方法 处理信息的信息单位,它不但非常精密而且容易出错,因此必要利用庞杂 的校准技能、量子偏差校订 技能和掌握 算法才气正常运行。此前,这种算法必需 依托传统超级盘算机极其苛刻的低延迟和高吞吐量举办 毗连,只有在这时才气掌握 量子比特偏差,从而实现相关的量子应用。

而 NVQLink 则供给 了上述进程 所必要的互连本领,为打造一些跨行业的应用供给 了所需的情况。黄仁勋公开表示,在不久的未来,每台基于英伟达 GPU 的科研型超级盘算机都将拥有混淆型的特点,并能与量子处理器紧密结合,从而能够扩大 盘算的大概性,终极为未来打造混淆量子·经典超级盘算机做好准备。

现在,用户可以通过与英伟达CUDA-Q 软件平台的集成来访问 NVQLink,从而实现 CPU 和 GPU 的无缝利用,以及创立 关于量子处理器的应用步骤 。

眼下,NVQLink 已经为 17 个量子行业机构、5 个掌握 器行业机构、9 家实行室实现了量子和 GPU 盘算的互连。英伟达称这一技能还能让量子处理器毗连到一些超级盘算实行室的设备上,现在 NVQLink 已经被用于美国布鲁克海文国度 实行室等实行室,正在资助量子从业人员 实现大年夜 规模量子盘算和量子纠错所需的掌握 算法,助力构建混淆型量子经典系统,加速实现化学范畴和原料 范畴的下一代应用。

参考资料:

https://nvidianews.nvidia.com/news/nvidia-nvqlink-quantum-gpu-computing

https://gizmodo.com/nvidia-supercomputers-for-trump-2000678264

0

路过

0

雷人

0

握手

0

鲜花

0

鸡蛋

推广
火星云矿 | 预约S19Pro,享500抵1000!
本文暂无评论,快来抢沙发!

有招是一个优质的生活妙招创作平台,在这里,你可以任意分享你的妙招经验,日常生活、技能学习、成长励志、恋爱婚姻……我们相信,每个人都有独特的生活妙招,有着无穷的创造力。
  • 官方手机版

  • 微信公众号

  • 商务合作