技术 | 如何破解“AI算力荒”困境?一文读懂异构协同的PPA优化

来源: 安谋科技 作者:安谋科技 2025-08-14 13:08:17

当智能手表实时解析心率波形、辅助驾驶系统毫秒级识别路况、机器人如人类般舞步流畅丝滑、数据中心高效训练千亿参数模型时,这些场景背后的芯片正面临前所未有的算力考验——不仅要处理爆炸式增长的计算需求,还要在方寸硅片上平衡#PPA(即Performance性能、Power功耗与Area面积)的精细关系。

 

异构计算 的兴起,恰为这场AI驱动的算力革命提供了全新思路。这种架构正在重塑芯片的效能边界,而其背后的逻辑与演进,正是理解智能时代底层算力基石的核心线索。

从PPA的三角关系到异构计算的破局路径

在芯片设计领域,PPA指标体系是衡量芯片综合竞争力的核心维度。性能决定任务处理速率,功耗影响续航能力和散热设计难度,面积则与制造成本和系统集成度紧密相关。这三项核心指标呈现显著的相互制约关系:性能提升往往伴随功耗增加,缩小面积可能导致散热效率下降进而限制性能发挥,而降低功耗又常以牺牲部分计算能力为代价。

  
当前,芯片设计深陷算力需求爆发与先进制程物理瓶颈的双重夹击。要破局并持续优化PPA,就需寻求创新架构,异构计算成为关键路径之一。根据Arm《AI处理的未来》报告,异构计算可将不同类型的处理器组合成统一的系统,以应对多样化的计算需求。这种架构不仅提高了整体效率,还能为实现能效最优解提供了技术基础。

  
异构计算提升PPA的核心在于使各处理单元专注其最擅长的任务。这使专用加速器在执行特定任务时的能效显著提升,且大幅缩短了数据处理路径,晶体管资源也得到更充分利用。最终,在严格面积约束下实现性能提升与功耗降低的协同优化,有效实现PPA参数的提升。

异构计算的协同分工体系  

在异构系统中,CPU、GPU与NPU各司其职,通过高效的软硬件协同机制共同应对复杂任务需求。通常,CPU负责系统协调与通用计算;GPU提供强大算力,支持大规模训练及高吞吐量运算;NPU则专注实时推理优化,实现高效AI加速。三者依赖统一的软件栈、硬件接口等实现任务无缝衔接。

  
例如,在辅助驾驶系统中,GPU对摄像头原始输入执行图像预处理,NPU执行核心AI推理,CPU整合识别结果,执行高级决策逻辑。该架构在执行神经网络负载时能效比显著优于普通SoC。

  
从系统协同视角看,NPU的加入构建了分工进化的算力生态:CPU从繁重的AI运算中解放出来,专注逻辑控制与任务调度;GPU继续在高精度计算中担当主力,NPU则凭借定制化硬件电路,原生高效执行卷积、池化等核心神经网络算子。

  
NPU更深层的价值还体现在,推动系统级软硬协同优化范式的成熟,借助专用AI编译器和运行环境,开发框架能够自动将AI模型的计算图高效映射至NPU硬件执行,开发者无需介入底层硬件,极大提升了开发效率。

安谋科技新一代“周易”NPU处理器就是这一趋势的代表性成果。该款处理器将对外带宽提高至256GB/s,全面支持FP16计算,并提供完整的int4软硬量化加速方案,在7nm制程工艺下,单Cluster算力最高可达80 TOPS。

  
在这些性能的加持下,面对复杂AI任务时,新一代“周易”NPU处理器可为终端设备的智能化升级提供强劲动力。例如,运行DeepSeek-R1的1.5B和7B蒸馏版本时,在标准单批次输入、上下文长度为1024的测试环境中,该处理器在首字计算阶段的算力利用率突破40%,解码阶段的有效带宽利用率高达80%以上。其带宽利用率呈现高线性特性,能够灵活适配16GB/s至256GB/s的系统带宽需求。在7B版本、1024上下文长度的场景下,其在充分保障模型应用精度的同时,最高处理速度可达40 tokens/s,并支持动态长度的模型推理输入。

异构计算的下一站

未来异构计算将演进为系统级的算力-数据-算法协同范式。正如《AI处理的未来》所预言,这一架构革命将驱动AI能力全面下沉至终端设备。更为关键的是,通过异构架构的动态重构能力,算力资源可依据场景需求实时流动,使系统在PPA的边界内始终维持最优工作点。

  
架构演进已在实际产品中显现。“此芯P1”以6nm工艺为基础,通过多核异构设计集成Arm CPU、GPU及安谋科技“周易”NPU等自研IP,形成融合Arm®技术与安谋科技自研业务产品的异构计算方案。其片上网络实现任务级数据直通,面向不同场景提供丰富AI异构计算资源与安全保障,更将能效表现提升至新高度,成为国产新一代AI PC的核心算力底座。

  
当3D堆叠突破物理限制,存算一体架构重构数据流范式,异构计算单元将彻底融入日常生活场景中。在这场计算架构的变革中,安谋科技将始终扮演技术桥梁与生态枢纽的关键角色,依托Arm先进技术与生态优势,坚持连接全球标准并打造本土创新,将自研业务产品与Arm CPU、GPU等通用计算单元深度融合,构建满足AI时代需求的异构计算解决方案,全方位赋能智能物联网、移动终端、智能汽车、基础设施等领域,迈向计算的未来。

0
收藏
0