企业 | Day 0适配GLM-5.1:壁仞科技率先完成智谱新一代旗舰模型适配

来源: 壁仞科技Birentech 作者:壁仞科技 2026-04-08 15:03:29

4月8日,智谱正式上线并开源新一代旗舰模型GLM-5.1。作为目前全球最强的开源模型,GLM-5.1在长程任务(Long Horizon Task)处理能力上实现了显著突破。壁仞科技(06082.HK)壁砺™166系列产品在模型发布当日率先完成适配,成为国内首批适配GLM-5.1的国产GPU厂商之一。

GLM-5.1基于BR166芯片完成推理任务

  

针对GLM-5.1的744B MoE架构、200K长上下文、DSA稀疏注意力等核心特性,壁仞科技开展全栈深度优化;依托自研芯片的高算力优势与BIRENSUPA™软件栈的算子级深度协同能力,基于vLLM、SGLang两大主流开源框架,精准适配40B激活参数与Interleave Thinking交叉推理模式,实现200K上下文无损推理。同时,通过MoE调度、稀疏计算、Tensor Parallel、Context Parallel、MTP等多重优化技术,实现低时延、高吞吐的高效推理。

  壁砺™166系列为数据中心大算力训推一体芯片,可满足万亿参数模型需求,广泛应用于大语言模型、多模态AIGC、图像与语音处理等领域。凭借卓越的技术成熟度与出色的开箱即用特性,壁砺™166系列产品可显著降低开发者的模型部署与应用门槛,以全栈化能力助力国产SOTA(目前最佳)大模型规模化落地,推动AI应用普惠向实。

关于GLM-5.1的官方介绍

相比于GLM-5,GLM-5.1的整体能力得到了全面提升,并在长程任务(Long Horizon Task)处理能力上实现了显著突破。有别于当前以分钟级交互为主的模型,GLM-5.1能够在单次任务中持续、自主地工作长达8小时,凭借自主规划、执行与迭代进化,最终交付完整的工程级成果。

 

一、综合性能SOTA

GLM-5.1是智谱迄今最智能的旗舰模型,也是目前全球最强的开源模型。下图是业内最具代表性的三个代码评测基准的平均结果,包括衡量模型专业级软件开发工作的SWE-Bench Pro、像工程师一样操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo。三项综合平均分,GLM-5.1取得全球模型第三、国产模型第一、开源模型第一的成绩。

在最接近真实软件开发的SWE-bench Pro基准测试中,GLM-5.1刷新全球最佳成绩,超过GPT-5.4、Claude Opus 4.6。

二、你睡觉的8小时,是模型上班的8小时

过去两年,行业用Benchmark衡量模型有多智能。GLM团队认为,下一阶段的衡量标准应该是“能工作多久”,即模型在长程任务(Long-Horizon Task)中的表现。在METR榜单的同等评估标准下,GLM-5.1是唯一达到8小时级持续工作的开源模型,也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

  

国产算力的快速适配能力,是大模型落地的核心支撑,也是国产AI产业崛起的核心引擎。目前,壁仞科技已具备与全球前沿算法协同进化的能力,并成为业内极少数全面适配SOTA大模型的国产算力厂商之一。壁仞科技将持续深化与国产大模型厂商合作,让开发者与客户在第一时间拥抱全球最前沿模型能力,推动国产大模型从“技术领先”迈向“应用领先”,共建开放繁荣、自主可控的人工智能产业生态。

专题

查看更多
机器人

企业 | 累计近10亿元!清华系具身创企连续完成两轮融资

灵巧手 | 市场全景扫描,谁将领跑全球量产革命?

灵巧手 | 国内外主控芯片方案深度解析

低空飞行器

市场 | 从白皮书数据看北斗规模化应用发展前景

技术 | “低空经济” 崛起,2025无人机市场暗藏哪些潜力趋势?

应用 | 从地面到太空:Qorvo卫星通信如何串联低空经济?

IC品牌故事

IC 品牌故事 | 三次易主,安世半导体的跨国迁徙

IC 品牌故事 | 开放合作+特色深耕,华虹的突围之路

IC 品牌故事 | Wolfspeed:从LED到SiC,被中国厂商围追堵截的巨头

0
收藏
0