您的位置:首页 >IT >

Nvidia看起来将把性能和功耗推向新的高度

导读 Nvidia 的 Ada 架构和推定的 GeForce RTX 40 系列显卡预计将于今年年底上市,并且可能在 9 月至 10 月的时间范围内。那是在Nvid

Nvidia 的 Ada 架构和推定的 GeForce RTX 40 系列显卡预计将于今年年底上市,并且可能在 9 月至 10 月的时间范围内。那是在Nvidia Ampere 架构之后的两年,考虑到摩尔“定律”的放缓(或者如果你愿意,死亡),基本上是按计划进行的。随着今年早些时候的Nvidia 黑客攻击,我们获得了关于预期结果的大量信息。我们已将所有内容收集到这个中央集线器中,详细介绍了我们对 Nvidia 的 Ada 架构和 RTX 40 系列家族的了解和期望。

Nvidia看起来将把性能和功耗推向新的高度

现在有很多谣言在流传,英伟达几乎没有透露其对 Ada 的计划,有些人将其称为 Lovelace。我们所知道的是,Nvidia 已经详细介绍了其数据中心Hopper H100 GPU,我们怀疑,就像Volta V100和Ampere A100一样,消费产品将在不久的将来跟进。

最后一个可能是预期的最佳样本。A100 于 2020 年 5 月正式发布,消费级 Ampere GPU 以RTX 3080和RTX 3090的形式推出大约四个月后。如果 Nvidia 遵循与 Ada Lovelace GPU 类似的发布时间表,我们可以预期 RTX 40 系列将在 8 月或 9 月的某个时候到货。让我们从 Ada 系列 GPU 的传闻规格的高级概述开始。

Nvidia GeForce RTX 40 系列“Ada”传闻规格
图形处理器 AD102 AD103 AD104 AD106 AD107
工艺技术 台积电 4N 台积电 4N 台积电 4N 台积电 4N 台积电 4N
晶体管数量 60B? 40B? 30B? 20B? 15B?
SM / CU 144 84 60 36 24
GPU 核心 18432 10752 7680 4608 3072
张量核心 576 336 240 144 96
RT 核心 144 84 60 36 24
升压时钟 (MHz) 1600-2000 1600-2000 1600-2000 1600-2000 1600-2000
总二级缓存 (MB) 96 64 48 32 32
显存速度 (Gbps) 21-24 21-24 16-21 16-21 14-21
VRAM 总线宽度 384 256 192 128 128
ROPs 128-196? 112? 96? 64? 48?
TMU 576 336 240 144 96
TFLOPS FP32(升压) 59-73.7 34.4-43 24.6-30.7 14.7-18.4 9.8-12.3
TFLOPS FP16(张量) 472-590 275-344 197-246 118-147 79-98
带宽 (GBps) 1008-1152 672-768 384-504 256-336 224-336
TDP(瓦) <600 <450 <300 <225 <150
估价 $1,000+ $600-$1,000 450-600 美元 300-450 美元 200-300 美元

首先,大量的盐需要应用于上述信息。我们已经为 GPU 提供了 1.6 到 2.0 GHz 的暂定时钟速度估计值,这与 Nvidia 之前的 Ampere、Turing 甚至 Pascal 架构一致。Nvidia 完全有可能超过这些时钟,因此我们认为这是一个保守的估计。

我们假设 Nvidia 将在所有 Ada GPU 上使用 TSMC 的 4N 工艺——“4nm Nvidia”,这在技术上可能又是不正确的。我们知道 Hopper H100 使用台积电的 4N 节点,这似乎主要是对台积电 N5 节点的调整变体,该节点已广泛用于苹果的智能手机和笔记本电脑芯片,并且传闻是 Nvidia 将用于 Ada 的节点,

坦率地说,节点名称并不像实际的 GPU 规格和性能那么重要。换句话说,“任何其他名字的玫瑰都会闻起来很香”。我们早就过了工艺节点名称与芯片上的物理特性有任何实际联系的地步。在 250nm(或 0.25 微米)芯片实际上具有可以指向并以 0.25um 宽度进行测量的元素时,芯片的物理缩放在过去的几个工艺节点上已经放缓,它们现在只是营销名称。

免责声明:本文由用户上传,如有侵权请联系删除!