PyTorch 2.5 今天发布,是这个广泛使用的机器学习库的最新重大更新。
PyTorch 2.5 改进了对客户端和数据中心图形产品的 Intel GPU 支持。PyTorch 2.5 现在对 Windows 上的 Intel 客户端 GPU 提供了初步支持,但也增强了现有的 PyTorch Intel Linux 图形支持。其中一些亮点包括:
– 扩展了 PyTorch 硬件后端支持矩阵,以包括 Intel 数据中心 GPU 和客户端 GPU。
– 实现 SYCL 内核以增强 Intel GPU 上 Aten 运算符的覆盖率和执行力,从而提高 PyTorch Eager 模式下的性能。
– 增强了 torch.compile 的 Intel GPU 后端,以提高各种深度学习工作负载的推理和训练性能。
PyTorch 2.5 还带来了各种 Intel Xeon CPU 性能优化。
PyTorch 2.5 的其他一些更改包括用于 H100 和更高 GPU 的 SDPA 的 NVIDIA cuDNN 后端、TorchInductor 的 CPU 后端优化、急切模式和 TorchInductor CPP 后端在 CPU 路径上的 FP16 支持、自动加载设备扩展支持以及各种其他增强功能。
通过 GitHub 下载有关 PyTorch 2.5 版本的更多详细信息。新的 PyTorch 基准测试即将推出。
转自 PyTorch 2.5 Released With Improved Intel GPU Support – Phoronix