,nvidia 现公布了即将推出的基于 arm 的 grace 超级芯片的最新测试成绩,该芯片将用于下一代数据中心和服务器,号称可以在同等功耗水平提供竞品两倍的性能。
根据 nvidia 提供的基准测试结果,与 amd 最快的 x86 数据中心 cpu“genoa”相比,grace可以在相同功耗下可提供约 1.7~2.5 倍的性能,相比英特尔 sapphire rapids 领先幅度更大。
当然,严格来说 grace 并不算传统意义上的 cpu,它基于 arm 的 neoverse n2 核心,采用了台积电 4n 工艺打造,这种“超级芯片”有 cpu cpu 和 cpu gpu 两种类型。
nvidia 最近还公布了旗下最强的 ai 和计算工作负载 gpu——gh200,它配备了世界上最快的 hbm3e 内存,而它也将被 grace hopper 超级芯片所采用。
grace 的一些主要亮点包括:
-
适用于高性能计算和云计算的高性能 cpu
-
最多 144 个 arm v9 cpu 核心的超级芯片设计
-
世界上第一个带有 ecc 内存的 lpddr5x,总带宽为 1tb / s
-
specrate2017_int_base 得分超过 740
-
900 gb/s相干接口,比 pcie gen 5 快 7 倍
-
封装密度是 dimm 九游会登录j9入口的解决方案的 2 倍
-
支持所有 nvidia 软件堆栈和平台,包括 rtx、hpc、ai 和 omniverse。
在 hot chips 2023 演示中,nvidia 首席科学家 bill dally 展示了 nvidia grace superchip 与其竞争对手之间的性能比较,包括 amd epyc 9654以及英特尔的旗舰产品 xeon platinum 8480 (56 核 112 线程)。it之家注:x86 支持双槽双 u 配置,因此 amd 平台总共有 192 核,英特尔平台总计 112 核。
从英伟达官方数据来看,nvidia grace 超级芯片总共提供了 144 个物理核心,支持 960 gb 的 lpddr5x 内存,原始带宽最高可达 1 tb / s,总功耗为 500w,其他规格还包括 117 mb 的 l3 缓存和 58 个 pcie gen5 通道。
nvidia 测试结果表明,grace 在诸如weather wrf、md cp2k、climate nemo、cfd openfoam 和 graph analytics gapbs bfs 这些基准测试中比 amd genoa cpu 强约 40%,而在相同的基准测试中遥遥领先于 intel sapphire rapids cpu。
不过,它在大多数场景中性能实际上与 genoa 相当,但 amd 两个芯片总 tdp 达到了 640w,而 grace superchip 运行功耗仅有 500w。
不过,当 grace与 genoa 在实际的大型数据中心应用进行比较时,性能领先幅度巨大,例如在 5 mw 测试中表现出了2.5 倍的性能,并且效率更是远超竞品。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,it之家所有文章均包含本声明。