• AI那么卷,怎能不会用CUDA实现卷积操作

         过去十年深度神经网络已成为最重要的机器学习模型之一,创造了从自然语言处理到计算机视觉、计算神经科学等许多领域的 SOTA 实现。   深度神经网络的特征注定其产生的计算量是巨大的,但也会产生大量高度并行化的工作,特别适合多核和众核处理器。深度学习领域的新研究思路往往是结合原生框架 operator 来实现的,一般编写专门的 GPU 内核可以解决过程中的性能损失问题,但也确实具有更高的挑战

    cuda

    机器之心 . 2021-10-08 2800

  • 英伟达的压箱底技术:利用CUDA实现光线追踪

         过去十年深度神经网络已成为最重要的机器学习模型之一,创造了从自然语言处理到计算机视觉、计算神经科学等许多领域的 SOTA 实现。   深度神经网络的特征注定其产生的计算量是巨大的,但也会产生大量高度并行化的工作,特别适合多核和众核处理器。深度学习领域的新研究思路往往是结合原生框架 operator 来实现的,一般编写专门的 GPU 内核可以解决过程中的性能损失问题,但也确实具有更高的挑战

    cuda

    机器之心 . 2021-09-16 2421

  • 微星推出CMP 50HX专业矿卡:3584个CUDA

    微星于近期推出了CMP 50HX MINER专业挖矿显卡。该卡基于图灵架构的TU102显示核心打造,内建有3584个CUDA核心,搭配10GB GDDR6显存,功耗为225W,供电接口为双8pin。 散热器采用涡轮式设计,标准的双槽厚度,有利于组件多显卡矿机。同时安装有金属背板,可提升显卡的耐用性。 由于定位于专业挖矿卡,因此这款显卡没有设计视频输出接口。

    msi

    泡泡网 . 2021-06-27 1954

  • 乘风破浪,掌握Python写CUDA的更多玩法

    近些年,随着数据量激增,对高性能计算、人工智能等领域中大规模的数据计算的需求也随之攀升,开发者越来越关注开发效率问题。 作为当前最主流的并行化程序编程方法之一,CUDA 能实现在 CPU 和 GPU 上的异构编程,有效地管理可用资源并提供最大化的执行速度增益。在当前火热的高性能计算、人工智能等领域,CUDA 都展现了它不俗的实力。 用 Python 进行 CUDA 开发,对开发者而言是一个非常理想

    cuda

    InfoQ . 2021-03-19 1801

  • 1
123