Qualcomm Cloud AI 100 加速器可满足各种边缘到云行业的需求。虽然 Qualcomm Cloud AI 硬件不像其他供应商的 AI 加速器那样被谈论得那么多,但主线 Linux 内核中有 QAIC 驱动程序,用于支持 Cloud AI 100 以及相关的开源编译器和用户空间堆栈。事实证明,随着 Cloud AI 80 “AIC080” 加速器以更低的成本进入市场,Qualcomm Cloud AI 系列正在不断壮大。
我还没有看到高通 AIC080 “Cloud AI 80” 被公开谈论,也没有在任何 Google 搜索结果中被突出提及。但是几分钟前,Linux 内核邮件列表中出现了一些有趣的补丁,经过一番搜索,Qualcomm 网站能够找到一些规范。
accel/qaic:添加 AIC080 支持补丁系列是我第一次看到提到这个新的 Qualcomm Cloud AI 80 产品。补丁封面信非常清楚地提到了这款新的 AIC080 产品:
“为新的 AIC080 产品添加基本支持。PCIe 设备 ID 为 0xa080。AIC080 是 AIC100 的低成本、低性能 SKU 变体。从 qaic 的角度来看,它与 AIC100 相同。
因此,从 QAIC 内核驱动程序方面来看,此 Cloud AI 80 支持只是用于添加新设备 ID 位的几行代码,否则遵循与 AIC100 相同的驱动程序路径。
这些补丁没有提供有关这种更便宜、精简的 Qualcomm Cloud AI 80 加速器硬件的任何其他详细信息。虽然在 Google 搜索结果或任何新闻/新闻发布中没有突出显示,但在此高通页面上提到了 Qualcomm Cloud AI 80 Ultra 和 Cloud AI 80 Standard。
Qualcomm Cloud AI 80 Standard 是一款额定功率为 75 瓦的 PCIe HHHL 加速卡,能够提供高达 190 TOPS 的 INT8 性能或高达 86 TFLOPS 的 FP16 性能。这低于 Qualcomm Cloud AI 100 Standard 上的 350 TOPS INT8 性能或高达 175 TFLOPS FP16。AI 80 Standard 和 AI 100 Standard 都有 16GB 的 RAM。Cloud AI 80 Ultra 是 AI 100 Ultra 的缩小版,采用 PCIe FH3/4L 外形尺寸。80 Ultra 和 100 Ultra 均具有 150 瓦 TDP 和 128GB LPDDR4x 内存 @ 548GB/s,但 AI 80 Ultra 可提供高达 618 TOPS INT8 和高达 222 TFLOPS FP16,而 AI 100 Ultra 可以达到 870 TOPS INT8 和高达 288 TFLOPS FP16 性能。
我还没有看到 Qualcomm Cloud AI 80 Ultra/Standard PCIe 加速卡的任何定价信息,但至少开源 Linux 驱动程序支持正在进行中。
转自 Qualcomm Linux Driver Prepares For New “AIC080” Lower-Cost Cloud AI Accelerator – Phoronix