今天为即将到来的 GCC 15 稳定版本合并了一个新的“X86_TUNE_AVX512_TWO_EPILOGUES”调优优化,默认情况下为 AMD Zen 4 和 Zen 5 处理器启用。
SUSE 编译器工程师 Richard Biener 编写了此补丁,在面向 AMD Zen 4 或 AMD Zen 5 处理器时添加了此“X86_TUNE_AVX512_TWO_EPILOGUES”调整及其默认启用。Biener 在现已提交的补丁中解释道:
“以下内容添加了 X86_TUNE_AVX512_TWO_EPILOGUES 调整,并指示矢量化器在设置时为 AVX512 矢量化循环生成矢量 AVX2 和 SSE 尾声。Zen4 和 Zen5 的调优默认启用,我对 SPEC CPU 2017 的性能和整体代码大小进行了基准测试。特别是,它加快了525.x264_r目前只有 AVX2 尾声以未矢量化代码结束的进程。
没有分享来自 SPEC CPU 2017 或任何其他基准测试的确切数据,以帮助量化这种额外的 AMD Zen 5/4 调整的实际性能影响。
随着该补丁现在在 Git 中,它将成为即将于 2025 年初发布的 GCC 15.1 稳定版本的一部分。
转自 GCC 15 Lands New Optimization For AMD Zen 4 & Zen 5 CPUs – Phoronix