NVIDIA CUDA 11是NVIDIA推出的运算平台,通过该平台可以使程序在支持CUDA的处理器上以高性能运算,继10代针对图灵结构做出优化知乎,不知道11会是否会针对30系列的Ampere结构做出对应的调整,有需要的用户不要错过了,欢迎下载使用!

软件简介
CUDA ®是NVIDIA发明了一种并行计算平台和编程模型。通过利用图形处理单元(GPU)的功能,可以显着提高计算性能。
CUDA的开发考虑了几个设计目标:
提供对标准编程语言(例如C)的一小部分扩展,这些扩展可实现并行算法的直接实现。使用CUDA C / C ++,程序员可以专注于算法的并行化任务,而不必花时间在其实现上。
在应用程序同时使用CPU和GPU的情况下支持异构计算。应用程序的串行部分在CPU上运行,并行部分被卸载到GPU。这样,CUDA可以增量地应用于现有应用程序。CPU和GPU被视为具有各自内存空间的单独设备。此配置还允许在CPU和GPU上同时进行计算,而不会争用内存资源。
具有CUDA功能的GPU具有数百个内核,这些内核可以共同运行数千个计算线程。这些内核具有共享资源,包括寄存器文件和共享内存。片上共享内存允许在这些内核上运行的并行任务共享数据,而无需通过系统内存总线发送数据。
使用说明
评估
对于现有项目,第一步是评估应用程序,以找到负责大部分执行时间的代码部分。有了这些知识,开发人员就可以评估这些瓶颈以进行并行化,并开始研究GPU加速。
通过了解最终用户的要求和约束并应用阿姆达尔定律和古斯塔夫森定律,开发人员可以通过加速应用程序已识别部分来确定性能改进的上限。
点击加载更多评论>>