皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

Arm展示了PGO和BOLT与LLVM/Clang的出色性能结果

Arm 软件工程师 Peter Waller 分享了一些关于各种类别的 Neoverse 处理器设计中 PGO、上下文敏感 PGO (CSPGO) 和 BOLT 优化影响的有见地的基准。

Peter Waller 分享了当前对配置文件引导优化 (PGO) 的性能优势以及 Meta/Facebook 为上游 LLVM 贡献的 BOLT 二进制布局优化的看法。我们经常在 AMD 和 Intel x86_64 硬件上看到引人入胜的编译器性能优化手段,因为这里的 AMD/Intel 硬件比其他架构更有趣,因此这个共享的性能数据对于 Arm Neoverse 世界来说是一个相当有趣的外观:

Arm展示了PGO和BOLT与LLVM/Clang的出色性能结果

事实上,在 Neoverse N1 / N2 / V1 / V2 中利用 PGO 和 BOLT 编译器优化,有一些非常好的加速。PGO 和 BOLT 对于提高性能非常有益,但确实依赖于准确的 profiles/traces,以便编译器可以做出明智的选择。

通过 LLVM Discourse 对 PGO 和 BOLT 进行 Arm 性能声明的更多详细信息。

转自 Arm Shows Off Great Performance Results For PGO & BOLT With LLVM/Clang – Phoronix

已有 0 条评论
已有 0 条评论
-->

登录

注册