近年来AI浪潮正以前所未有的速度向前推进,如今已经从云端数据中心,延伸至我们身边的每一个设备中。据SHD Group的《边缘AI市场分析报告》预测,到2030年边缘AI SoC市场规模将达到800~1000亿美元,另据VDC Research分析,到2028年,AI将成为物联网各类项目中应用占比最高的主导性技术。
也就是说未来几年,边缘AI将进入蓬勃发展阶段。在10月30日举行的Arm Unlocked 2025深圳站上,Arm面对持续增长的AI算力需求,宣布将持续推进“平台优先”战略,在高性能、高能效,以及高可扩展性的底层计算架构基础上,携手产业各方共建从云到端的AI计算平台。
Armv9架构下放,重塑边缘计算力
今年Arm Unlocked 2025深圳站最大的亮点,莫过于Arm今年初发布的全球首个Armv9架构的边缘AI计算平台,该平台以Arm Cortex-A320 CPU和Arm Ethos-U85 NPU为核心,专为物联网应用进行了优化,可支持运行超过10亿参数的端侧AI模型。而且,该Armv9边缘AI计算平台已于近期纳入了Arm技术授权订阅模式中的Arm Flexible Access方案,以帮助初创企业和OEM厂商加速其下一代智能边缘设备的研发进程。
“我们将Armv9架构首次带到了功耗和成本极其敏感的物联网设备中。”Arm物联网事业部硬件产品管理高级总监Lionel Belnet在接受媒体采访时强调。这意味着,以往仅在高端智能手机或服务器中才能见到的企业级安全特性,如指针验证(PAC)、分支目标识别(BTI)和内存标记扩展(MTE),将成为未来智能门锁、工业传感器等边缘设备的“标配”。

图:Arm 物联网事业部硬件产品管理高级总监 Lionel Belnet
Lionel 解释道:“随着设备端软件及数据价值的提升,安全不再是可选项。我们将这些高级安全功能下放,且通过软件生态的成熟支持,不会给合作伙伴带来额外的硬件成本。”
性能的跃升则更为直观。得益于Armv9架构引入的第二代可伸缩矢量扩展(SVE2)等技术,Cortex-A320的机器学习(ML)性能相较于前代Cortex-A35实现了惊人的10倍提升,且整体标量性能也提升了30%,功耗效率提高了50%。

图:Arm Cortex-A320的性能提升
“这10倍的提升指的是计算密度,”Lionel进一步指出,“几乎每一代新架构,我们都能通过引入矩阵乘法指令等新功能,实现性能翻倍。”

将如此强大的计算平台纳入Arm Flexible Access,更是Arm生态战略的一次精妙落子。该方案允许初创公司和中小型企业以极低甚至免费的成本,获取Arm广泛的IP组合进行前期研发和验证,直到芯片流片时才需支付授权费。目前,该方案已经有300多家活跃成员,其中,在中国吸引了超过70家合作伙伴,全球累计成功流片超400次。此举无疑将极大激发整个产业链的创新活力,加速催生出更多具备颠覆性的边缘AI产品。
CPU+NPU:应对AI模型“日新月异”的最优解
在AI时代,硬件面临的最大挑战之一,是追赶软件和算法的迭代速度。那么,当合作伙伴的NPU算子无法支持层出不穷的新模型时该如何应对?
Lionel给出的答案是,“这正是Arm平台灵活性的核心价值所在,”他表示,“CPU与NPU是协同工作的。当模型完成全面优化和量化后,NPU能提供极致的效率。但当遇到NPU无法支持的新算子时,CPU则凭借其通用性和架构灵活性,通过向量扩展等技术高效运行这些算子。这种组合提供了真正的优势互补。”

他强调,Arm的职责是提供一个高度灵活、可扩展的平台。开发者可以在CPU上快速验证新模型,然后逐步将成熟的部分迁移至NPU以追求极致效率。这种“软硬协同”的开发模式,确保了合作伙伴的产品在长达数年甚至十余年的生命周期内,依然能够与时俱进。
软件生态:创新的“护城河”
如果说强大的IP是Arm的“利剑”,那么庞大而成熟的软件生态则是其不可逾越的“护城河”。
活动中,KleidiAI软件库被反复提及。它被集成到PyTorch、ExecuTorch等主流AI框架中,如同一个“翻译官”,让上层的AI应用可以无缝调用Arm底层硬件的加速能力。例如,在Llama.cpp上运行微软的Tiny Stories小语言模型时,KleidiAI为Cortex-A320带来了近70%的性能提升。
“我们通过与Meta等公司的紧密合作,确保开发者在Arm架构的边缘设备上部署PyTorch模型时,能够获得‘开箱即用’的便捷体验。”Lionel表示。
在中国市场,Arm的本地化生态合作同样深入。例如,与百度的合作,已在Ethos-U85 NPU上成功部署了九款经典的PaddleLite视觉模型。这些举措极大地降低了开发者的入门门槛,让他们可以专注于应用创新,而非底层硬件的适配。
结语:始于边缘,终于场景
从更自然的语音交互、更智能的安防摄像头,到工厂里进行预测性维护的工业机器人,边缘AI的价值最终要通过具体的应用场景来体现。它解决了AI普惠化过程中最关键的几个痛点:对即时响应的延迟需求、对个人数据的隐私关切、对电池续航的能效要求、对云端传输的成本考量,以及在网络中断时的韧性保障。
Arm此次通过技术下放、优化商业模式和深化软件生态,正试图构建一个繁荣的“热带雨林”,让各种形态的边缘AI“物种”都能在其中自由生长。面对中国本土芯片产业的崛起,Lionel的回应也显示出Arm的自信:“持续创新、灵活的商业模式,以及强大的软件生态,是我们保持领先的关键。”
Lionel更是强调,未来,Arm 将持续深化与中国产业的协同创新,加速 AI 技术的普惠化落地,助力千行百业迈向智能化升级的新阶段。

全部评论