Meta与NVIDIA打造最大超算系统RSC,2022年底将扩充到16,000个GPU

来源: 飛蝈 2022-01-27 20:13:21

  MetaNVIDIA合作打造最大超算系统RSC 2022年底将扩展16,000GPU

  Facebook 母公司 Meta 宣布 2017 年后再度采用 NVIDIA GPU 打造第二世代 AI 研究基础设 RSC ( Research SuperCluster ),目前已完成第一段的架,采用 760 NVIDIA DGX A100 节点、共 6,080 A100 GPU ,并预计 2022 年末第二段完工后一扩展 16,000 GPU 预计性能 5 exaflops 混合精度 AI 性能,模胜于微 AI 研究室的 10,000 GPU 届时 RSC 地表最大型的 A100

  RSC 的目的是作 Meta 新一代 AI 用的基础设施与研究系,例如提供多人即时语音翻功能,使不同言的使用者能作或游戏时进行即时沟通,或是即有害容、自然理等,届时第二段完工后, Meta 的目标将是利用 RSC 训练一兆 AI 模型。

   RSC 基于 NVIDIA SuperPOD架构,自到完成 18 时间

  受惠于 NVIDIA SuperPOD架构, RSC 的建设过使多少受到 COVID-19 ,自划到落成仍 18 时间即完成第一段的安,目前由 760 DGX A100 ,以 NVIDIA Quantum 200Gb/s InfiniBand 接,以 6,080 NVIDIA A100 提供 1,895 petaflops TF32 算力,并由 Penguin Computing 提供托管服 AI 优化基础设施,其中包括 46PB 存系 Altus

   2017 Meta 所建的第一代 AI 研究机构,当时使用 22,000 NVIDIA V100 Tensor Core GPU 成,乍看下 RSC GPU 量完工后的 GPU 总数反而少,但在新一代架构加持下, RSC 行大型自然言模型训练速度第一世代快 3 ,而在机器视觉的性能一口气提升 20

0
收藏
0