最近,我通过 GPTshop.ai 远程进行了英伟达 GH200 Grace CPU 基准测试,除了查看 64K 内核页面大小等方面的性能优势外,我还运行了一些新的基准测试,查看在 Ubuntu Linux 上由 LLVM Clang 而非默认 GCC 编译器生成二进制文件时的性能差异。本文展示了 72 核 Neoverse-V2 服务器/高性能计算处理器在使用 LLVM Clang 而不是 GNU 编译器集时的性能差异。
本轮测试是上个月在 GPTshop.ai GH200 服务器上进行的一些简单的编译器基准测试。考虑到编译器的重点,我们测试了使用 Ubuntu 23.10 AArch64 默认的 GCC 13.2 编译器与通过 Ubuntu 23.10 压缩包提供的 LLVM Clang 17.0.2 编译器构建的各种 CPU 工作负载。在 Ubuntu 23.10 Linux 上使用该高性能 ARM64 服务器测试这两种编译器选项时,使用了相同的编译器标志。
这些基准测试主要是出于参考和好奇的目的,以了解 Clang 生成的二进制文件的 AArch64 性能与 GCC(大多数 Linux 发行版的默认编译器)相比如何。我曾做过许多 x86_64 Clang 基准测试,供有兴趣的人参考,因为我有大量的英特尔和 AMD 处理器,但周围的 AArch64 硬件却不多。感谢 GPTshop.ai 远程提供英伟达 ARM64 服务器用于基准测试。
转自 LLVM Clang Shows Off Great Performance Advantage On NVIDIA GH200’s Neoverse-V2 Cores – Phoronix