Arm 软件工程师 Peter Waller 分享了一些关于各种类别的 Neoverse 处理器设计中 PGO、上下文敏感 PGO (CSPGO) 和 BOLT 优化影响的有见地的基准。
Peter Waller 分享了当前对配置文件引导优化 (PGO) 的性能优势以及 Meta/Facebook 为上游 LLVM 贡献的 BOLT 二进制布局优化的看法。我们经常在 AMD 和 Intel x86_64 硬件上看到引人入胜的编译器性能优化手段,因为这里的 AMD/Intel 硬件比其他架构更有趣,因此这个共享的性能数据对于 Arm Neoverse 世界来说是一个相当有趣的外观:
事实上,在 Neoverse N1 / N2 / V1 / V2 中利用 PGO 和 BOLT 编译器优化,有一些非常好的加速。PGO 和 BOLT 对于提高性能非常有益,但确实依赖于准确的 profiles/traces,以便编译器可以做出明智的选择。
通过 LLVM Discourse 对 PGO 和 BOLT 进行 Arm 性能声明的更多详细信息。
转自 Arm Shows Off Great Performance Results For PGO & BOLT With LLVM/Clang – Phoronix