皇上,还记得我吗?我就是1999年那个Linux伊甸园啊-----24小时滚动更新开源资讯,全年无休!

AI存储时代 Arm准备好了!三管齐下 软硬兼施

近日在深圳举办的MemoryS 2025闪存峰会上,存储行业的众多龙头企业纷纷登台亮相,Arm的出现则可能让很多人感到意外。

事实上,Arm作为全球领先的计算平台公司,不仅仅服务于移动计算行业,更是以开放生态为核心,切实推动AI与存储技术的深度融合,推动从云端到边缘端的智能化转型。

本届峰会上,Arm物联网事业部业务拓展副总裁马健发表演讲,系统性地阐述了Arm在AI计算与存储领域的技术创新、生态共建、未来战略,并在会后接受了快科技的采访。

AI存储时代 Arm准备好了!三管齐下 软硬兼施

马健指出,近30年来,Arm架构产品一直是数据存储与网络控制的基石,为全球存储控制器和设备提供高性能、低功耗、安全可靠的解决方案。

- Cortex-R系列实时处理器:拥有最快的中断延时和实时反应速度,广泛应用于诸多存储设备。

- Cortex-M系列嵌入式处理器:后端闪存和媒体控制的热门选择,支持自定义指令,客户可以针对不同闪存进行深度优化。

- Cortex-A系列应用处理器:高吞吐量流水线设计,支持最高处理性能,同时拥有机器学习、数据处理软件、丰富操作系统的广泛生态支持。

- Ethos-U AI加速器:Transformer原生加速可高达每秒2048 MACs,让存储控制器本身变得更智能。

- Neoverse基础设施平台:为数据中心量身定制,CXL采用Arm CMN(一致性网格网络)与Neoverse组合,实现可“组成式”内存扩展,并结合近存储计算,减少数据搬运。

其实,大量我们熟悉的存储类产品,幕后都是Arm在默默支撑。

比如,Solidigm首发的全球最大容量122.88TB SSD D5-P5336,其主控就采用了Arm Cortex-R CPU。

慧荣科技的新一代PCIe 5.0 SSD主控芯片SM2580,用的就是Arm Cortex-R8、Cortex-M0 CPU,业界首款车用PCIe Gen4主控芯片SM2264XT-AT,同样基于Arm CPU架构。

AI存储时代 Arm准备好了!三管齐下 软硬兼施

AI存储时代 Arm准备好了!三管齐下 软硬兼施

AI存储时代 Arm准备好了!三管齐下 软硬兼施

AI的快速发展,对基础算力提出了新的要求,包括高性能、低功耗、灵活扩展性等,而传统的标准通用芯片在处理计算密集型的AI工作负载时,往往显得力不从心。

在此背景下,Arm计算平台为新一代AI云基础设施带来了Neoverse CSS平台解决方案、Total Design生态项目、CSA芯粒系统架构,具有高效、灵活、可扩展的显著优势,也帮助合作伙伴可以快速打造差异化的产品,满足AI新需求。

同时,为了应对边缘侧对AI计算需求的增长,Arm还发布了全新的边缘AI计算平台,包括基于Armv9架构、拥有超高能效的Cortex-A320 CPU处理器,以及原生支持Transformer网络的Ethos-U85 AI加速器。

该平台实现CPU处理器与AI加速器的深度配合,具备强大的计算能力,是边缘侧AI设备运行大模型、复杂任务的理想解决方案,可运行10亿以上规模参数的大模型。

AI存储时代 Arm准备好了!三管齐下 软硬兼施

在马健看来,生成式AI和大模型从爆发到现在虽然才短短三年时间,但已经得到了广泛而深入的行业规模部署,边缘计算也在进入AI时代后发生了显著的变化。

一是计算能力大幅提升,软硬件协同优化。

边缘计算节点正突破传统的“小型网关+通用CPU”模式,向智能化方向加速演进。通过深度集成GPU、FPGA、NPU等异构计算单元,边缘设备已经实现了更强的并行计算性能,同时具备更强的AI推理加速能力。

同时,边缘设备的软件栈也日益完善,越来越多厂商针对AI推理场景提供轻量化推理框架,比如ExecuTorch、TensorFlow Lite、ONNX Runtime、飞桨PaddleLite等等,从而在资源受限的环境下,运行高效的模型推理。

二是从“数据传输中心”转变为“实时智能中心”。

早期的边缘计算主要承担数据预处理和缓存功能,大量原始数据需要输送至云端,再进行分析和训练。

现在,AI模型尤其是推理部分,正越来越多地在边缘设备上实现本地化执行,以满足实时性、隐私合规等需求。

边缘节点不再只是数据“传输管道”,而是进化为提供实时智能服务的中心节点,这不仅有效减轻了云端的带宽与存储负担,还使得决策过程更贴近实际应用场景,实现了毫秒级的快速响应。

三是模型生命周期管理与协作深化。

云边之间的协作更加紧密,云端负责大模型的训练及更新,边缘侧则专注轻量化推理与在线更新。

在此过程中,对边缘侧模型的部署与运维变得尤为重要,包括模型分发、滚动升级、A/B 测试等。

为此,需要依赖自动化的MLOps平台在边缘侧发挥关键作用,确保整个模型生命周期的高效管理与无缝协作。

针对边缘计算的未来发展趋势,Arm正从硬件、软件、生态三个方面协同发展,释放边缘AI的重要价值。

硬件方面,就是刚才说过的全新边缘AI计算平台。

软件方面,Arm去年推出了Kleidi软件库,首先用于智能手机和服务器市场,现已扩展到了汽车和物联网领域。

这是一套专为AI框架开发者设计的计算内核,可以在Arm CPU上获取最佳性能,支持包括Neon、SVE2 等在内的Armv9架构的关键特性,大幅提升了AI计算效率。

Kleidi已集成到多个主流AI框架,包括Llama.cpp、ExecuTorch、LiteRT,可以加速Llama 3、Phi-3等主流AI大模型

生态方面,Arm已将Armv9架构Cortex处理器系列全面的性能和生态引入智能物联领域,包括极致性能的Cortex-X925,以及适合低成本、低功耗大规模智能部署的全新Cortex-A320,因此无论边缘AI设备的需求如何,都能找到最合适的处理器方案。

例如,Cortex-A320支持多种操作系统, FreeRTOS/Zephy等实时操作系统(RTOS),Linux、Android等功能丰富操作系统,都能提供高效支持。

AI存储时代 Arm准备好了!三管齐下 软硬兼施

Arm在边缘计算领域一直有着广泛的布局,不仅涵盖CPU、GPU、NPU等IP核产品线,还深入软件工具链、标准化平台、安全解决方案等多个维度。

随着AI技术在边缘侧应用的迅猛发展,如智能制造、智慧城市、车载计算、智能家居等,Arm正在三个方面重点发力:

一是打造CPU+GPU+NPU三大引擎组成的异构计算IP。

CPU方面,Cortex系列将不断强化通用算力,具备卓越性能和能效的Cortex-A/R/M系列,超高性能Cortex-X系列,以及专为基础设施设计的Neoverse系列,可以满足更广泛的算力需求。

比如Neoverse优化了多核心多线程、虚拟化,非常适合边缘服务器、智能网关等场景,保持功耗优势的同时提供高吞吐性能。

比如超高能效Cortex-A320,非常适合大规模、低成本、低功耗的智能部署。

GPU方面,Mali系列在移动端、智能终端市场应用广泛,未来将继续增强通用计算能力,兼顾图形渲染和部分AI推理需求,支持流畅、自然、直观的人机交互体验。

NPU方面,Ethos系列AI加速器已原生支持Transformer神经网络,可与 CPU、GPU 协同构建异构计算平台,支持运行超过10亿参数小模型。

Ethos可在有限面积与功耗下提供高效AI算力,适合在智能物联网、智能视觉、智能可穿戴、工业控制等边缘场景中,部署轻量化或中等规模的深度学习推理。

二是云-边-端协同的软件赋能。

从云基础设施、边缘AI计算平台到终端AI处理,Arm KleidiAI都能为开发者提供基于Arm计算平台的一致体验,实现从云到端的无缝衔接。

在国内,KleidiAI已集成到腾讯混元大模型中,加速端侧AI推理的速度。

阿里通义千问Qwen2-VL-2B-Instruct模型同样集成了KleidiAI,可以在基于Arm CPU的移动设备上,运行多模态AI工作负载。

未来,Arm计划推出更多软件库、计算内核、引擎集成,持续在Arm平台上构建新的AI赋能。

三是强化安全与信任。

安全与隐私保护是边缘AI大规模部署的重点,也是Armv9架构处理器和边缘AI计算平台的主要发展方向。

在硬件级安全方面,Arm在架构层面强化了TrustZone、TEE等安全机制,Armv9架构支持Secure EL2、指针验证/分支目标识别(PACBTI)、 内存标记扩展(MTE)等安全指令,并符合PSA Certified 规范。

在软件可信堆栈方面,针对边缘环境OTA在线升级、远程管理的需求,Arm将持续与各类操作系统或云平台合作,完善从Bootloader到应用层的安全链条。

马健强调,随着边缘AI的快速发展,将会有更多、更复杂的AI工作负载,转向边缘设备进行处理。

Arm重点始终是面向市场、面向合作伙伴,提供满足当下和未来各个领域AI应用工作负载的解决方案。

AI存储时代 Arm准备好了!三管齐下 软硬兼施

【本文结束】如需转载请务必注明出处:快科技

责任编辑:上方文Q

转自 AI存储时代 Arm准备好了!三管齐下 软硬兼施–快科技–科技改变未来

已有 0 条评论
已有 0 条评论
-->