中国电子技术网

设为首页 网站地图 加入收藏

 
 

AI时代,Arm如何引领边缘AI革新?

关键词:Arm边缘AI革新

时间:2025-03-18 10:00:49      来源:Arm

当AI大模型的热潮持续两年后,行业关注的焦点正从云端训练转向端侧推理。数据显示,全球边缘计算市场规模将从2020年的90亿美元飙升至2030年的4450亿美元,年复合增长率高达48%。这背后是AI技术与端侧场景的深度耦合——从智能穿戴到工业质检,从实时翻译到视觉识别,边缘AI正在重构产业智能化的底层逻辑。

作者: 付斌

当AI大模型的热潮持续两年后,行业关注的焦点正从云端训练转向端侧推理。数据显示,全球边缘计算市场规模将从2020年的90亿美元飙升至2030年的4450亿美元,年复合增长率高达48%。这背后是AI技术与端侧场景的深度耦合——从智能穿戴到工业质检,从实时翻译到视觉识别,边缘AI正在重构产业智能化的底层逻辑。

Arm作为边缘计算领域的“幕后英雄”,其架构支撑着数十亿边缘设备的运行。近日,Arm推出全球首个Armv9边缘AI计算平台。该平台专为物联网应用优化,以全新的Cortex-A320 CPU和Ethos-U85 NPU为核心,支持运行超10亿参数的端侧AI模型。其中,全新的基于Armv9架构的超高能效Cortex-A320 CPU,其能效比较Cortex-A520提升了50%,更与Ethos-U85 AI加速器组成了边缘AI时代的”黄金搭档“,助力大模型与生成式AI在物联网领域的落地。Arm不仅是“算力供给者”,也是“场景赋能者”。

最近两年的AI技术日新月异,在如此高速发展的态势之下,Arm全新的边缘AI计算平台背后有哪些关键点值得关注?对于AI行业的热点,Arm又有什么见解?EEWorld与Arm物联网事业部业务拓展副总裁马健进行了深度访谈,并对一些热门问题进行了解析。

Armv9边缘AI计算平台:Arm为未来边缘计算和AI处理提出的新范式

此次发布的Armv9边缘AI计算平台实现了CPU和AI加速器的深度配合。Cortex-A320可以为Ethos-U85提供更高的内存容量与带宽,让大模型在Ethos-U85上的执行如虎添翼。任何开发者们不希望在Ethos-U85上运行的AI操作,可以回退到Cortex-A320,利用其Neon/SVE2引擎更灵活有效地在CPU上执行。这使得智能物联网与消费类电子生态系统能够在正确的时间,并在合适的地方运行最适合的工作负载。

马健表示,Arm此次发布的平台不仅仅是一次渐进式的升级,更代表了Arm为未来边缘计算和AI处理提出的新范式。Cortex-A320是Arm首个专为物联网应用设计的Armv9架构处理器,它将超高能效与先进AI能力相结合,实现了前所未有的突破。当Cortex-A320与Ethos-U85结合时,将催生出全新的应用类别,为边缘侧AI应用拓展更多可能性。

Cortex-A320的独特之处

全新边缘AI计算平台将覆盖多个应用场景,实现包括视觉和自然语言在内的多模态的环境感知与理解,进而运行智能体AI、自主规划、执行复杂任务等。该平台具备强大的计算能力,Cortex-A320与Ethos-U85的组合,比去年基于Cortex-M85搭配Ethos-U85的平台提升了八倍的ML计算性能,带来了显著的AI计算能力突破。

那么此次推出的超高能效Cortex-A320 CPU与Cortex-M85相比,究竟有哪些独特之处?

对此,马健深度解析了Cortex-A320和Cortex-M85的差异,具体包括:

第一,从内存支持的角度,Cortex-M85作为一款32位的嵌入式处理器,最多能支持的内存寻址空间是2的32次方,也就是4GB左右。在这样一个有限的内存空间内,需要运行操作系统、其他程序以及进行内存管理等,那么留给运行模型的空间就会非常小。相比之下,Cortex-A320是64位处理器,在内存方面能够给到很好的支持。

第二,从内存的分层管理角度,SRAM肯定是首选,但在需要更大内存容量时,DRAM的加入变得至关重要。然而,一般的Cortex-M系列上面所运行的操作系统很难同时管理DRAM、SRAM,并优化DRAM的时延。Cortex-A系列可以运行比较丰富的操作系统,这些操作系统本身其实就可以帮助完成这一任务,并且能够更快地推动产品上市。

第三,从生态角度,Arm的Cortex-A处理器系列的产品生态更加丰富。举例来说,对于Android生态中的数百万个应用程序,借助Cortex-A的生态,这些应用都可以无缝地移植到超高能效的设备上。

Arm对于产业热点及趋势的解析

热点之一:DeepSeek


DeepSeek是最近一段时间的热点,很多边缘芯片和设备厂商都纷纷宣布支持接入DeepSeek。

马健就此表示,DeepSeek在减小模型尺寸、增加模型效率方面带来了创新。DeepSeek-R1最小可做到1.5B的体量,可以让边缘设备游刃有余地部署这些模型。DeepSeek降低了计算成本,并为更多边缘AI应用提供了重要机会。对于深耕计算领域的Arm而言,这代表了创新的速度正在加快,尤其是推理工具的创新速度,这也展现出了行业对计算性能和能效日益增长的需求。

热点之二:智能眼镜

近来非常火热的智能眼镜正成为快速发展的新兴市场,而Arm技术已被广泛应用于智能眼镜等智能可穿戴设备,比如市场上颇受瞩目的Meta Ray-Ban AR智能眼镜,其搭载的正是Arm CPU。

因智能眼镜体积小巧、重量轻盈,并且需要直接佩戴在面部,智能眼镜对功耗及散热有着极为严苛的要求。一旦散热效果不理想,使用者在佩戴过程中便极易产生不适之感,严重影响产品体验。

谈及智能眼镜这一热门应用,马健表示,Arm Cortex-A320在性能和功耗上有着卓越表现。相较于之前的Cortex-A CPU,Cortex-A320在能效方面有大幅提升。相信Cortex-A320搭配Ethos-U85的这一组合对于智能眼镜来说会是一个很好的解决方案。

热点之三:边缘侧训练

当被问及AI在边缘侧是否也有训练需求时,马健认为,有些场景是需要在边缘进行一些重训练的,尤其是在智能制造领域,鉴于数据隐私和安全的考量,很多厂商不愿将生产数据上传至云端。因此,当面临新数据或新零件质检时,若需对模型进行更新或微调,这些工厂更倾向于在边缘侧或终端侧进行操作。如果计算量比较小,比如只有几个新的样本,可以对模型做一些后训练微调,这完全可以在Cortex-A320搭配Ethos-U85的边缘AI计算平台上进行。但如果本地收集数据量比较多,就可能需要部署在边缘的AI服务器进行重训练。

热点之四:场景碎片化

此外,这几年很多企业都会谈到“边缘AI场景碎片化”。对此,马健认为这是一个悖论。她表示,像数据中心这类场景,各企业用的计算平台都非常类似,即使是有不同的数据中心加速器,所实现的功能也大都相近。而边缘侧应用种类繁多,很难通过一种选择满足各类需求,针对性能、功耗的组合也更加多样化,但这并不意味着我们不能通过某种方式来提供一定程度的统一性和灵活性,Arm边缘AI计算平台就是一个很好的范例,用IP异构的方式构建平台解决方案,给边缘侧的合作伙伴提供更优的性能和更大的灵活性。

  • 分享到:

 

猜你喜欢

  • 主 题:便携式电子产品与 AI 时代下的 WiFi 与 BLE 技术革新
  • 时 间:2025.03.25
  • 公 司:Arrow&村田

  • 主 题:芯引擎——为工业以太网打造芯动力
  • 时 间:2025.04.17
  • 公 司:瑞萨电子&新晔电子