GTC | NVIDIA在全球首个Agent原生电脑问世

来源: 新智元 作者:ASI启示录 2026-06-01 17:20:48

英伟达中国台北GTC大会,大幕拉开!

就在刚刚,老黄再次站上绝对C位,开启了震撼全场的主题演讲——有用AI的时代,全面来临。

全场压轴好戏,是英伟达首款RTX Spark「超级芯片」!

  

它史无前例地搭载了6144个GPU核心、128GB统一内存,把过去只有数据中心才有的算力,塞进了一台笔记本。

  

全球首款专为Agent打造的Windows PC,此刻诞生了。

一眼看懂老黄这场2小时硬核演讲:

Vera Rubin全面量产,组装一个机架从两小时砍到五分钟

Vera CPU登场,第一颗不为人、只为Agent造的CPU

RTX Spark(N1X),全球首台为个人Agent打造的个人电脑

Nemotron 3 Ultra开源,英伟达最大模型,5500亿参数

超级芯片RTX Spark首秀PC被彻底重新发明

这场大会最重量级的发布,非「超级芯片RTX Spark」莫属。

「四十年后,英伟达要和微软,一起重新发明PC」!

黄仁勋这句话一出口,全场炸了。

  
他先讲了段历史。Windows 3.1时代,PC还只是企业的工具,直到Windows 95,才把PC变成了人手一台的消费电子。

  

而今天,那个让一切发生的「DirectX加应用」组合,要被「LLM加Agent」彻底取代。

  

大模型,就是新时代的DirectX。Agent,就是新时代的应用。

  

然后,他掏出了那颗「超级芯片」RTX Spark,核心是和联发科联手打造的N1X CPU。

  

这是有史以来能效最高的PC芯片!

  
老黄说,这是英伟达把33年的全部积累,蒸馏进了一颗芯片。

Blackwell RTX GPU,6144个CUDA核心,1 PFLOP的AI算力

定制20核Grace CPU,与联发科联手打造

128GB统一内存,NVLink全程融合

台积电3nm工艺,700亿晶体管

  
英伟达100%的软件栈,全跑在这上面。

更重磅的是,这不止一台笔记本。

  

微软和英伟达一口气端出桌面、笔记本、工作站三件套,全部100% Windows兼容、100% CUDA、100% Tensor Core。

  

那台桌面机最有意思。它能让Agent7天24小时跑着,不计费。

  

没有额度焦虑,下载一个本地模型,这个Agent就彻底是你自己的。

而那台名叫DGX Station for Windows的怪兽,直接堆到768GB内存、20 PFLOPS算力、8TB/s内存带宽。

  

未来在个人桌面上,跑一个万亿参数的模型,都不是问题。

  

老黄说,这是四十年来第一次,整条PC产品线被推倒重来。一条新的产品线,一个新的开始。

Vera Rubin全面量产为Agent而造

接下来,当传闻中的「性能怪兽」Vera Rubin真机登场那一刻,全场瞬间沸腾。 

 

老黄在台上掷地有声,「Vera Rubin不只是为了跑AI而生的,它是为了运行Agent而生」!

如今,Vera Rubin正全面投入量产。

  

供应链规模是上一代Grace Blackwell的两倍。过去组装一个机架要两个小时,现在只要五分钟。

  

你没看错,五分钟。

当场,他对Vera Rubin真机来了一次「解剖」。

Vera Rubin NVLink 72,整个系统的核心大脑,72块Rubin GPU加36颗Vera CPU

Vera CPU机架,256颗全液冷CPU

Vera BlueField存储与安全处理系统

Mellanox网络系统,世界上第一个CPO共封装光学

  
最抓眼球的,是Vera Rubin硬件形态的终极进化,无电缆、无软管、无风扇。

老黄把它从台上推走时还调侃,后面大概有2000个人在拉。

Vera CPU:老黄把CPU重造了一遍

在Vera Rubin背后,植入的是英伟达专为Agentic AI时代打造的CPU,Vera CPU。

  

老黄的解释很深刻,「到今天为止,世界上所有的CPU都是为人造的。这一刻,Vera CPU是给智能体用的」。

  

既然是为Agent定制的CPU,Vera必须具备超越常理的特性。老黄总结了三个硬核指标。

第一,世界第一的单核性能。

Vera做到了每个时钟周期抓取、解码、执行10条指令,创下世界最高纪录。

第二,每核带宽和总线带宽,刷新天花板。

Vera内部用一张「光速级」的Scalable Coherency Fabric把所有核心连起来,没有chiplet税,没有跨芯片边界的损耗。

  

它还是第一颗用上PCIe Gen6的CPU,配1.2TB/s的LPDDR5X带宽,是市面最强x86 CPU的2到3倍。

第三,极致的能效。

把尽可能多的CPU塞进AI数据中心,又不能抢走生成token那点宝贵的电力。

  

实测里,对比x86,Vera CPU跑SQL的速度狂飙3倍。盯纽交所那种实时流处理,更是直接拉到6倍。

  

老黄给了一个极致的比喻,「CPU是指挥家,GPU是交响乐团」。

Agent,就是新的「操作系统」

老黄抛出了一个更底层的判断,「我们进入了全新的Agent时代,智能体就是未来的操作系统」。

  

传统时代,计算机的运行逻辑是,应用层加代码加操作系统。

  

而今天,这个架构变成了,智能体+Harness。

输入与感知、推理与规划、工具调用与行动,加上短期和长期记忆,构成了智能体完整的工作流。

这里面,LLM负责「思考」,而Harness就像一个操作系统,负责连接一切、调度信息。

  

硬件就位,还差软件生态。

  

现场,老黄端出了NVIDIA Agent Toolkit,四层架构。

  

模型层,Nemotron 3 Ultra,英伟达最大的开源模型,约5500亿总参数,每token激活550亿

  

框架层,支持Claude Code、Codex、OpenClaw等各种Agent直接运行

  

工具和技能层,CUDA X库全部附带skills文件,Agent自学即用

  

运行时层,OpenShell,英伟达的开源安全运行时,Apache 2.0

这四层叠起来,就是一个无敌的Agent系统。

  

就拿英伟达和Cadence联合打造的「芯片设计超级Agent」来说。

  

其中,Codex负责总指挥,Cadence ChipStack启动RTL验证循环,底层跑Nemotron模型,外层套OpenShell做安全。

  

Agent自己跑仿真、做形式化验证、发现设计缺陷、修复代码bug,整个过程自驱动,人类工程师可以在任何环节介入。

  

验证周期从数周压缩到数小时,加速超过40倍。

这就是Agentic AI。为了这一天,英伟达已经准备了整整两年!

算力就是营收,AI工厂来了

对AI大厂来说,他们其实不想买计算机,想要的是一座AI工厂。

 

于是英伟达又往上长了一层,叫DSX,一套AI工厂的施工蓝图。

先在Omniverse里建一座数字孪生工厂,电力、散热、网络全部模拟验证一遍,一个机架还没运到,整座工厂已经在虚拟世界里跑通了。

工厂一通电,DSX OS接管运营。

  

DSX Max LPS负责榨电,今天的AI工厂普遍超配电力高达40%,而它能在同样的电力预算下塞进更多GPU,45度的热液冷更省水更省电。

老黄说,到本世纪末,100吉瓦的AI工厂要陆续上线。

  

算力就是营收,算力就是利润。没有营收和利润,就是亏损。

  

这一层,把英伟达从一家卖芯片的公司,彻底变成了一家卖整座工厂的公司。

这里,老黄再次祭出了自己的经典语录:「买越多,赚越多!」

Agent时代,用户再不是人类

两个小时,几十个发布点砸下来。

 

但老黄从头到尾,其实只讲了一句话。过去四十年,计算机是为人造的。从今天起,它要为Agent造。CPU重做,PC重新发明,数据中心重构,软件栈重搭,全是这一句话的注脚。

  

上一个敢说「重新发明PC」的人,掏出来的是iPhone,它重新定义了人和设备的关系。

  

这一次,老黄掏出来的东西看着没那么性感,但它要重新定义的是另一件事。

  

谁,才是这台设备真正的主人。

专题

查看更多
机器人

企业 | 累计近10亿元!清华系具身创企连续完成两轮融资

灵巧手 | 市场全景扫描,谁将领跑全球量产革命?

灵巧手 | 国内外主控芯片方案深度解析

低空飞行器

市场 | 从白皮书数据看北斗规模化应用发展前景

技术 | “低空经济” 崛起,2025无人机市场暗藏哪些潜力趋势?

应用 | 从地面到太空:Qorvo卫星通信如何串联低空经济?

IC品牌故事

IC 品牌故事 | 三次易主,安世半导体的跨国迁徙

IC 品牌故事 | 开放合作+特色深耕,华虹的突围之路

IC 品牌故事 | Wolfspeed:从LED到SiC,被中国厂商围追堵截的巨头

0
收藏
0