皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

Intel 发布 x86-simd-sort 6.0 以实现快速 AVX2/AVX-512 排序,PyTorch 现在正在使用它

Intel 的 x86-simd-sort 项目是一个有趣的开源软件项目,通过使用 AVX-512 实现更快的数字排序。AVX-512 和 AVX2 代码路径实现了闪电般快速的数字排序,以扩大对帮助没有 AVX-512 的 CPU 的吸引力。像 Numpy 这样的项目一直在使用这个库,而今天 x86-simd-sort 6.0 已经发布,也是在 PyTorch 也开始使用这个库几天后发布的。

x86-simd-sort 6.0 版本增加了对键值数据类型的 qselect 和部分排序的支持,使用 OpenMP 编译指示加速键值排序,AVX2 对键值排序/部分排序/objsort 方法的支持,英特尔 LLVM 编译器支持,以及对所有排序例程的降序排序的支持。在具有几个唯一值的 daa 上工作时,预期性能也会更好。

通过 GitHub 下载有关所有 x86-simd-sort 6.0 更改的更多详细信息。

Intel 发布 x86-simd-sort 6.0 以实现快速 AVX2/AVX-512 排序,PyTorch 现在正在使用它

早在 6 月,就向 PyTorch 提出了这个合并请求,以开始使用 x86-simd-sort 在 x86/x86_64 上更快地排序。大型数组的加速提高了 10 倍。截至上周,该代码已合并到 PyTorch 中,以便在使用 AVX2 或 AVX-512 的系统上更快地进行排序。torch.sort 和 torch.argsort 函数将获得高达 10 倍的收益。

转自 Intel Releases x86-simd-sort 6.0 For Speedy AVX2/AVX-512 Sorting, PyTorch Now Using It – Phoronix