去年 11 月,在 AMD 第 5 代 EPYC“Turin”服务器处理器发布后,ZenDNN 5.0 作为其针对 EPYC/Ryzen 处理器优化的深度神经网络库。ZenDNN 5.0 是其神经网络库的更新版本,与 Intel oneDNN/DNNL 的 API 兼容,反过来可以与 PyTorch 等软件一起使用。事实证明,ZenDNN 5.0 能够在相同的硬件上提供比之前 ZenDNN 软件版本高 400% 的性能提升。
本月早些时候,AMD 发布了一篇博客文章,正式宣布了 ZenDNN 5.0 软件库。他们不仅谈到了其 Zen 5 / Turin CPU 支持,而且 ZenDNN 5.0 平均可以提供 400% 的性能提升。
本月早些时候,AMD 工程师 Shailen Sobhee 概述了 ZenDNN 5.0 版本及其提供 400% 性能提升的能力。与 ZenDNN 4.2 相比,在 Llama 2/3.1 等一系列模型上进行的测试平均产生了 400% 的性能提升。这是使用 PyTorch 的 ZenDNN 插件测量的。与 IPEX 2.4 相比,作为 Intel 的 PyTorch 扩展,它也获得了非常好的收益。
除了支持第 5 代 AMD EPYC“Turin”/Zen 5 CPU 支持外,ZenDNN 5.0 还为 LLM 提供了高级自动调整、INT4 仅权重量化、生成式 LLM 的新 API 和其他优化。
有关 ZenDNN 5.0 软件版本及其 400% 性能提升的更多详细信息,请参阅 AMD 开发者中心上的技术文章。只要时间允许,我将尽快开发一些我自己的 ZenDNN 5.0 独立基准测试。
转自 AMD ZenDNN 5.0 Software For AI Delivers “400% Performance Uplift” – Phoronix