高性能计算 | 五大国产 CPU 企业,哪家的产品性能最强?

来源: 芯查查资讯 作者:程文智 2025-05-12 09:41:00
近年来,国产CPU行业诞生了不少优质企业,比如华为海思、飞腾、海光信息、龙芯中科、兆芯、申威等。目前这些企业的CPU产品都各具特色,引领着国产CPU行业向前发展。

重点内容速览:

1. 华为海思:致力打造全场景处理器生态

2. 飞腾:谱系最全的国产CPU企业

3. 海光信息:x86领域性能指标最高 

4. 龙芯中科:从MIPS到自主LoongArch架构

  

国产CPU的发展早于GPU,其实在“十五”期间,即2001年开始,我国就启动了泰山计划来发展国产CPU产业;2006年启动的核高基专项,国产CPU行业迎来了一轮国家支持。随后的中美科技对抗,集成电路行业成为焦点,都纷纷投入了更多资源。

  
近年来,国产CPU行业诞生了不少优质企业,比如华为海思、飞腾、海光信息、龙芯中科、兆芯、申威等。目前这些企业的CPU产品都各具特色,引领着国产CPU行业向前发展。比如华为海思的鲲鹏系列CPU芯片和飞腾的CPU性能不断提升,在华为的推动下,兼容Arm架构的国产操作系统、数据库等基础软件纷纷推出,兼容性得到显著增强;海光信息与兆芯的CPU芯片能够兼容主流x86生态,产品各项指标也在不断提高;龙芯中科的MIPS架构和自研指令集CPU产品也有一定的市场竞争力,申威主要在超算领域得到使用。

华为海思:致力打造全场景处理器生态

华为海思旗下的芯片产品有很多,其CPU产品鲲鹏系列芯片是华为计算战略的重要组成部分,华为正致力于打造一个完整的计算产业生态。

  
华为的鲲鹏通用计算平台可以提供基于鲲鹏处理器的TaiShans服务器、鲲鹏主板及开发套件。硬件厂商可以基于鲲鹏主板发展自有品牌的产品和解决方案;软件厂商基于openEuler开源OS以及配套的数据库、中间件等平台软件发展应用软件和服务;鲲鹏开发套件可帮助开发者加速应用迁移和算力升级。

目前鲲鹏通用计算平台主要是基于鲲鹏920开发设计的。据海思官网介绍,鲲鹏920是基于华为获得的Arm v8架构永久授权而自主研发设计的CPU产品,采用了先进的7nm工艺,拥有多核心和高主频。其主频可达2.6GHz,单芯片可支持64核,是业界首个内置直出100GE网络能力的通用处理器。

  
鲲鹏920集成了8通道DDR4,总内存带宽最高可达1.5Tb/s;支持PCIe 4.0及CCIX接口,总带宽640Gbps。

图:鲲鹏920处理器主要特性(来源:海思官网)

华为海思通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,大幅提高处理器性能。典型主频下, SPECint Benchmark评分超过930,超出业界标杆25%。同时,能效比优于业界标杆30%。鲲鹏920以更低功耗为数据中心提供更强性能。

  
目前,华为围绕鲲鹏处理器打造了“算、存、传、管、智”五个子系统的芯片族,并提供从底层硬件到上层应用的完整解决方案,包括服务器、操作系统(如EulerOS)、数据库(如GaussDB)等。

  

生态方面,鲲鹏通用计算平台,兼容全球Arm生态,为开发者和用户提供了广阔的应用空间。而且,华为还积极推动鲲鹏计算产业生态建设,通过“硬件开放、软件开源、使能伙伴、发展人才”的策略,吸引众多合作伙伴,共同繁荣鲲鹏生态。

  
在应用方面,鲲鹏处理器主要面向通用计算领域,尤其是在服务器市场有重要应用。广泛应用于大数据处理、分布式存储、云计算,以及金融、电信等信创场景。

  

飞腾:谱系最全的国产CPU企业

与华为海思一样,飞腾也拥有Arm v8指令集架构的永久授权。飞腾早期尝试过多种指令集,但最终重点转向了Arm系列产品的开发,并实现了CPU计算模块(内核)在内的代码部分的自主研发。
 

目前飞腾CPU产品具有谱系全的特点,主要包括高性能服务器CPU(飞腾腾云S系列)、高效能桌面CPU(飞腾腾锐D系列)、高端嵌入式CPU(飞腾腾珑E系列)和飞腾套片四大系列。这些产品为从端到云的各种类型设备提供核心算力支持。  

图:飞腾系列国产 CPU 产品谱系图(来源:飞腾)

飞腾的CPU产品性能在不断提升,其2024年推出的服务器CPU芯片飞腾腾云S5000C拥有64核、32核、16核3种产品形态,兼容ARMv8指令集,支持硬件虚拟化,产品支持商业和工业分级,该产品主要面向计算服务器、存储服务器、AI服务器、高端网安、行业级业务主机服务器系统、大型互联网数据中心等场景。

图:飞腾腾云S5000C产品技术规格(来源:飞腾)

最新一代的高效能桌面CPU腾锐 D3000 是目前国内性能最强的Arm架构桌面 CPU,集成了 8 个飞腾自主研发的新一代 FTC862 高性能处理器内核,主频最高可达 2.5 GHz,性能较上一代有大幅提升。该产品集成了丰富的拓展接口,支持飞腾自主定义的处理器安全架构规范 PSPA 2.0,能够满足更复杂应用环境下用户对于性能和安全可信的需求。
 

在嵌入式CPU方面,飞腾拥有腾珑E系列高端嵌入式CPU,比如其腾珑E2000高端嵌入式CPU,该系列包括E2000Q、E2000D、E2000S三个系列,芯片集成飞腾自主研发的高能效和低功耗处理器核,E2000Q集成2个FTC664和2个FTC310处理器核,E2000D集成2个FTC310处理器核,E2000S集成1个FTC310处理器核,兼容64位ARMv8指令集并支持ARM64和ARM32两种执行模式,支持单精度、双精度浮点运算指令和ASIMD处理指令,支持硬件虚拟化,产品支持商业和工业分级。该产品面向云终端、行业平板、电力、轨道交通、服务器 BMC、网络设备和智能控制等行业领域和场景,满足复杂多样的产品应用需求,具备高安全、高可靠、低功耗等特点。
 

此外,飞腾正加速布局 “CPU+XPU” 组合拳,新一代服务器芯片飞腾腾云 S5000C 和桌面芯片飞腾腾锐 D3000,已实现对 DeepSeek 全系列大模型的端到端支持,推理效率与国外同类方案相当。同时,团队着手开发兼容国际主流生态的 AI 软件栈,加快推进自主可控算力芯片研发,培育新质生产力。
 

值得一提的是,飞腾最大的优势在于生态方面,飞腾与国内众多软硬件厂商构建了国内较为完善的生态体系。比如在2024年2月,华为、CEC联手打造基于Arm等基础架构的“鹏腾”生态,鲲鹏处理器、飞腾处理器的服务器和PC机已规模应用于政府、运营商、金融、电力等各大国计民生行业的核心业务场景,形成鲲鹏和PKS两大主流生态。
 

通过构建统一的“鹏腾”生态,将简化生态伙伴的软硬件适配和认证,使能伙伴开发更多形态的产品,可覆盖云、数据中心、边缘、PC终端等全场景,更好地赋能千行百业的数字化,并推动相关合作向AI等领域延伸。
 

截至 2024年12月底,飞腾的生态伙伴已超过 7100 家,共联合软硬件厂商支撑了 5500 多款飞腾平台设备上市,已经和正在适配的软件超过 70000 种,构建起了国内完善、庞大的从端到云信息化建设全栈生态体系。飞腾系列CPU芯片累计在国家重点工程和关键行业部署应用超过1000万片。

海光信息:x86领域性能指标最高

海光信息成立于2014年,是一家Fabless企业,公司产品包括海光通用处理器(CPU)和海光协处理器(DCU),具有成熟而丰富的应用生态环境,内置专用安全硬件,可满足互联网、金融、能源等行业的广泛应用需求。
 

2016年,海光信息与AMD合资成立了两家子公司,成都海光微电子技术有限公司和成都海光集成电路设计有限公司。海光信息通过海光微电子和海光集成分别于2016年和2017年与AMD签署《技术许可协议》获得了AMD的技术授权,包括x86指令集和Zen架构。
 

海光信息对获得的AMD授权技术进行了消化、吸收、改进和提高,并在此基础上自主研发推出了海光系列CPU产品和深算系列DPU产品。目前,海光信息已经掌握了高端处理器核心微结构设计、SoC架构设计等关键技术。2017年至2023年,海光陆续推出多款海光通用处理器及海光协处理器产品,产品矩阵逐渐丰富。
 

海光信息CPU产品主要分为7000、5000和3000系列,分别应用于高端服务器、中低端服务器,以及工作站和边缘计算服务器等领域。这些产品内置多个处理器核心,集成通用的高性能外设接口,拥有完善的软硬件生态环境和完备的系统安全机制。海光CPU遵循“销售一代、验证一代、研发一代”的产品研发策略,目前已推出海光一号、海光二号、海光三号CPU产品,海光三号是主力销售产品,海光四号和海光五号处于研发阶段。
 

其中,7000系列主要面向数据中心、5000系列面向行业客户、3000系列面向多场景应用。7000系列集成了16~32核心,支持128路PCIe通道,8个DDR4内存通道;单颗CPU最大支持2TB内存容量;2000系列集成了8~16核心,支持64路PCIe通道,4个DDR4内存,单颗CPU最大支持1TB内存容量;3000系列集成4~8核心,支持32路PCIe通道,2个DDR4内存通道,最高加速频率达到3.3GHz。
 

海光信息最近披露了其产品路线图,其中包括即将推出的一款旗舰级128核512线程处理器C86-5G。具体来说,该芯片将配备多达128个核心,并支持同步多线程(SMT)技术。特别值得关注的是,它并未使用主流服务器芯片常见的双向SMT (SMT2),而是采用了四路SMT (SMT4),这代表着每个核心可以处理四个线程。因此,C86-5G 得以在128个核心的基础上实现惊人的512个线程功能。不过,海光信息并没有透露C86-5G使用的具体微架构。
 

此外,C86-5G 拥有一系列丰富的功能,以支持服务器和企业级工作执行。包括支持AVX-512 指令集,以及支持16信道DDR5-5600 內存,这比C86-4G 的12信道DDR5-4800 配置有所提升。支持16个內存通道,这将使海光的新平台能够容纳巨大的內存容量。
 

在生态方面,海光信息的CPU兼容国际主流x86处理器架构,支持国内外主流操作系统、数据库、中间件等基础软件及广泛的行业应用软件。在安全性方面,海光信息CPU原生支持可信计算。通过扩充安全算法指令、集成安全算法专用的加速电路等方式,有效提升了数据安全性和计算环境的安全性。海光信息CPU支持国密算法,内置可信计算平台,支持中国标准TPCM和国际标准TPM2.0。
 

在应用方面,海光信息CPU芯片已经广泛应用于电信、金融、互联网、教育、交通等重要领域。 

龙芯中科:从MIPS到自主LoongArch架构

龙芯中科公司前身成立于2008年3月,并在2010年开始市场化运作,致力于将龙芯处理器研发成果进行产业化。而龙芯CPU处理器,是中科院计算所2001年就开始研发的产品。

  

龙芯最开始是基于MIPS的授权设计CPU产品的,不过现在已经开始转向其自主指令系统LoongArch(龙芯架构)构建独立于Wintel体系和AA体系的开放性信息技术体系和产业生态。LoongArch 指令系统已通过国内权威第三方机构的知识产权评估,认定与ALPHA、ARM、MIPS、POWER、RISC-V、X86为不同的指令系统设计。LoongArch架构从架构上进行了重新设计,吸纳了现代指令系统演进的最新成果,运行效率更高。

  

在2025中关村论坛年会上,搭载新一代国产服务器CPU的双路服务器——龙芯3C6000/D 2U首次亮相。该服务器采用2片基于龙芯自主指令的龙芯3C6000/D处理器,共64个物理核,128个逻辑核,搭载龙芯 7A2000 独显桥片,核心元器件国产化率达100%,可满足通用计算、大型数据中心、云计算中心的计算需求。龙芯3C6000系列芯片采用的就是“龙架构”而设计的。

  

龙芯3C6000基于龙芯3A6000相同的LA664架构内核,单硅片最多16核心32线程,支持双路、四路、八路直连,也就是单系统最多可以做到128核心256线程。通过龙链互连技术(Loongson Coherent Link),可以实现片间互联,并成倍降低片间的访问延迟,双硅片可整合封装为龙芯32核心64线程,四硅片可整合封装为龙芯64核心128线程。实测结果表明,相比上一代服务器CPU龙芯3C5000,其通用处理性能成倍提升,已达到英特尔公司推出的中高端产品至强(Xeon)Silver 4314 处理器水平。

  

据了解,含龙芯3A6000、龙芯3C6000、龙芯3B6000、龙芯3A5000(DA版)、龙芯3C5000、龙芯3D5000在内的共6款电脑芯片和服务器芯片入围《安全可靠测评结果公告》Ⅱ级认证,龙芯以40%占比成为入选《安全可靠测评结果公告》最多的芯片企业。

  

生态系统方面,龙芯中科致力于完全自主的CPU生态建设,公司基于信息系统和工控系统两条主线开展产业生态建设。龙芯构建了完整的基础软件技术生态体系,开展操作系统内核、编译器、编程语言虚拟机、云计算等基础软件领域的研发工作,形成了面向信息化应用的基础版操作系统Loongnix及面向工控类应用的基础版操作系统LoongOS。公司与数千家厂商建立了合作关系,涉及的开发人员达到数十万人,基于龙芯CPU的生态已逐渐形成。

  

应用方面,龙芯系列产品在电子政务、能源、交通、金融、电信、教育等行业领域已获得广泛运用。特别是在工控领域,龙芯CPU已成为国内上百家厂商的产品基础,应用领域不断拓展。在政企办公等行业应用中,基于龙芯CPU的各类整机设备年销售量达到上百万套规模,市场份额持续领先。

  

此外,兆芯也是采用x86架构,但其IP授权来自于威盛电子,架构较为落后,自主性相对较低。产品性能相比其他国产CPU厂商来说存在一定差距。其最新的CPU产品开先KX-7000系列处理器采用了全新"世纪大道"微架构,支持AVX2的4发射宽度核心,其乱序执行窗口与2010年代初的英特尔CPU相当。兆芯不仅扩展了核心宽度并增强延迟容忍度,还致力于提升主频。KX-7000运行频率为3.2 GHz,显著高于KX-6640MA的2.6 GHz。兆芯官网称KX-7000可达3.5-3.7 GHz,但实际测试中未观察到其超过3.2 GHz。

  

申威主要专注在超算领域,其代表产品为申威系列CPU,该系列CPU采用Alpha指令集与其基于Alpha架构自研的SW-64指令集。

 

 结语

国产CPU在自主可控与市场化之间逐步找到平衡,虽在单核性能、生态成熟度上仍存差距,但通过政策扶持、技术迭代和生态协同,正加速缩小与国际巨头的距离。未来十年,随着信创深化和全球供应链重构,国产CPU有望在特定领域实现“进口替代”,并向全球市场拓展。

0
收藏
0