HPE 展示 Exascale 硬件:AMD 和 Intel 的平台曝光
在国际超级计算机 (ISC 2022) 贸易展上,HPE 展示了刀片系统,这些刀片系统将为今年将上线的两台百亿亿级超级计算机——Frontier 和 Aurora 提供动力。不幸的是,HPE 不得不使用复杂且耗电的硬件来获得前所未有的计算性能。因此,两台机器都使用液体冷却,但即使是巨大的水冷块也无法隐藏刀片具有的一些有趣的设计特点。
Frontier 和 Aurora 超级计算机均由 HPE 使用其 Cray EX 架构构建。虽然这些机器分别利用 AMD 和 Intel 硬件,但它们使用高性能 x86 CPU 来运行一般任务,并使用基于 GPU 的计算加速器来运行高度并行的超级计算和 AI 工作负载。
Frontier 超级计算机建立在 HPE 的 Cray EX235a 节点之上(在新标签中打开) 由两个 AMD 的 64 核 EPYC(霄龙)“Trento”处理器提供支持,该处理器采用该公司的 Zen 3 微架构,增强了 3D V-Cache 并针对高时钟进行了优化。Frontier Blades 还配备了八个 AMD 的 Instinct MI250X 加速器(在新标签中打开) 具有 14,080 个流处理器和 128GB 的 HBM2E 内存。每个节点提供约 383 TFLOPS 的峰值 FP64/FP32 矢量性能和约 765 TFLOPS 的峰值 765 FP64/FP32 矩阵性能。HPE Frontier 刀片使用的 CPU 和计算 GPU 都使用统一的液体冷却系统,节点前部有两个喷嘴。
极光之 刃(在新标签中打开) 目前就是这样称呼的,带有英特尔徽章,还没有 HPE 的 Cray Ex 型号,可能是因为它还需要一些打磨。HPE 的 Aurora 刀片采用两个英特尔至强可扩展“蓝宝石急流”处理器,每个插槽具有 40 多个内核和 64GB HBM2E 内存(除了 DDR5 内存)。这些节点还具有六个英特尔的 Ponte Vecchio(在新标签中打开)加速器,但英特尔对这些包含超过 1000 亿个晶体管 的野兽的确切规格保持沉默 (在新标签中打开).
与2 ExaFLOPS Aurora 超级计算机一起使用的 Aurora 刀片组引人注目的一件事 (在新标签中打开) 是带有三角形“热表面”标志的神秘黑盒子,位于 Sapphire Rapids CPU 和 Ponte Vecchio 计算 GPU 旁边。我们不知道它们是什么,但它们可能是模块化复杂的电源电路,以增加灵活性。毕竟,在过去, VRM 是可拆卸的(在新标签中打开),因此即使在今天(假设满足正确的电压容差),将它们用于高耗电组件也可能有意义,尤其是对于预生产硬件。
同样,Aurora 刀片对其 CPU 和 GPU 使用液体冷却,尽管这种冷却系统与 Frontier 刀片使用的完全不同。有趣的是,Aurora 刀片中的 Ponte Vecchio 计算 GPU 使用的水冷块似乎与英特尔 展示的不同(在新标签中打开) 几周前,尽管我们只能想知道可能的原因。