企业 | Day 0适配GLM-5.1：壁仞科技率先完成智谱新一代旗舰模型适配

4月8日，智谱正式上线并开源新一代旗舰模型GLM-5.1。作为目前全球最强的开源模型，GLM-5.1在长程任务（Long Horizon Task）处理能力上实现了显著突破。壁仞科技（06082.HK）壁砺™166系列产品在模型发布当日率先完成适配，成为国内首批适配GLM-5.1的国产GPU厂商之一。

GLM-5.1基于BR166芯片完成推理任务

针对GLM-5.1的744B MoE架构、200K长上下文、DSA稀疏注意力等核心特性，壁仞科技开展全栈深度优化；依托自研芯片的高算力优势与BIRENSUPA™软件栈的算子级深度协同能力，基于vLLM、SGLang两大主流开源框架，精准适配40B激活参数与Interleave Thinking交叉推理模式，实现200K上下文无损推理。同时，通过MoE调度、稀疏计算、Tensor Parallel、Context Parallel、MTP等多重优化技术，实现低时延、高吞吐的高效推理。

壁砺™166系列为数据中心大算力训推一体芯片，可满足万亿参数模型需求，广泛应用于大语言模型、多模态AIGC、图像与语音处理等领域。凭借卓越的技术成熟度与出色的开箱即用特性，壁砺™166系列产品可显著降低开发者的模型部署与应用门槛，以全栈化能力助力国产SOTA（目前最佳）大模型规模化落地，推动AI应用普惠向实。

关于GLM-5.1的官方介绍

相比于GLM-5，GLM-5.1的整体能力得到了全面提升，并在长程任务（Long Horizon Task）处理能力上实现了显著突破。有别于当前以分钟级交互为主的模型，GLM-5.1能够在单次任务中持续、自主地工作长达8小时，凭借自主规划、执行与迭代进化，最终交付完整的工程级成果。

一、综合性能SOTA

GLM-5.1是智谱迄今最智能的旗舰模型，也是目前全球最强的开源模型。下图是业内最具代表性的三个代码评测基准的平均结果，包括衡量模型专业级软件开发工作的SWE-Bench Pro、像工程师一样操作命令行解决问题的Terminal-Bench 2.0、从零构建完整代码仓库的NL2Repo。三项综合平均分，GLM-5.1取得全球模型第三、国产模型第一、开源模型第一的成绩。

在最接近真实软件开发的SWE-bench Pro基准测试中，GLM-5.1刷新全球最佳成绩，超过GPT-5.4、Claude Opus 4.6。

二、你睡觉的8小时，是模型上班的8小时

过去两年，行业用Benchmark衡量模型有多智能。GLM团队认为，下一阶段的衡量标准应该是“能工作多久”，即模型在长程任务（Long-Horizon Task）中的表现。在METR榜单的同等评估标准下，GLM-5.1是唯一达到8小时级持续工作的开源模型，也是全球范围内除Claude Opus 4.6外少数具备这一能力的模型。

国产算力的快速适配能力，是大模型落地的核心支撑，也是国产AI产业崛起的核心引擎。目前，壁仞科技已具备与全球前沿算法协同进化的能力，并成为业内极少数全面适配SOTA大模型的国产算力厂商之一。壁仞科技将持续深化与国产大模型厂商合作，让开发者与客户在第一时间拥抱全球最前沿模型能力，推动国产大模型从“技术领先”迈向“应用领先”，共建开放繁荣、自主可控的人工智能产业生态。