英特尔的 IDXD 驱动程序是在 Linux 下启用数据流加速器 (DSA) 的原因,自 Sapphire Rapids 以来,它是英特尔在其至强处理器上的加速器产品的一部分。随着今天发布的补丁,IDXD 驱动程序将帮助硬件在出现错误时恢复,以提供更强大的体验。
今天在 Linux 内核邮件列表上发布的补丁使英特尔 IDXD 驱动程序能够在数据流加速器遇到硬件错误时执行 PCIe 功能级别重置 (FLR)。与在发生此类问题时仅打印错误的现状相比,FLR 复位允许更强大的恢复。
“启用 FLR for IDXD halt”补丁系列说明:
“当 IDXD 设备遇到硬件错误时,它会进入停止状态并触发对 IDXD 驱动程序的中断。目前,IDXD 驱动程序仅在中断处理程序中打印错误消息。
处理中断的更好方法是执行功能级复位 (FLR) 并将设备的硬件和软件配置恢复到以前的工作状态。中断后,设备和软件可以继续运行。
此系列为WQ均为用户类型的IDXD设备启用此FLR处理。WQ 为内核类型的 IDXD 设备的 FLR 处理将在未来的系列中实现。
这些 IDXD 补丁现在正在审查中,有望在即将到来的内核系列中被选中……距离 Linux v6.11 合并窗口只有一两周的时间,届时这些补丁是否会被认为准备就绪,或者是否会被推迟到更高的内核版本还有待观察。
转自 Intel IDXD Driver To Better Handle Accelerators In Event Of Hardware Errors – Phoronix