1
GPU及GPU加速简要介绍
GPU是图形处理器(Graphics Processing Unit)的英文缩写,主要用于处理图形和图像相关的计算任务。最初设计用于图形渲染,但随着其并行计算能力的发展,GPU也被广泛应用于科学计算、机器学习、深度学习等领域。
GPU相比于传统的中央处理器(CPU),具有更多的核心和更高的并行性能,使其能够同时处理大量的数据和运算任务。这使得GPU在某些计算密集型任务上具有明显的优势。例如,在深度学习训练中,利用GPU可以加速神经网络的计算过程,大幅缩短训练时间。除了用于图形渲染和科学计算外,GPU还在加速密码学、仿真、视频编码解码等领域发挥着重要作用。近年来,随着人工智能和深度学习技术的兴起,GPU得到了更广泛的应用,并成为这些领域中不可或缺的计算加速器。
从1980年代IBM推出单色显示适配器起始,GPU的发展已经有四十年的历史。但GPU参与科学计算是在2000年之后才开始慢慢发展的。2007年,GPU计算迎来了一个重要的拐点,英伟达发布了专用的CUDA(Compute Unified Device Architecture)开发环境。2008年,由苹果公司发起,后有AMD,英特尔,高通等公司协作的开源跨平台开发环境OpenCL(Open Computing Language)也正式发布。
2
GPU与CPU的区别
架构和设计:
CPU通常设计用于处理通用计算任务,如逻辑运算、控制流程、串行任务等。它具有较少的核心,但每个核心都非常强大,适合处理复杂的单线程任务。
GPU则设计用于处理图形和并行计算任务。它具有大量的小型核心,适合同时处理大量并行计算任务,如图形渲染、科学计算和机器学习等。
并行性能:
CPU在处理单个线程时具有很强的性能,但在处理大规模并行任务时性能有限。
GPU在处理大规模并行任务时拥有显著的优势,因为它的大量核心能够同时处理多个计算任务。
内存访问:
CPU通常拥有更高速的缓存和内存访问能力,适合处理需要频繁读写内存的任务。
GPU的内存带宽通常更大,适合处理大规模数据并行处理任务。
用途:
CPU广泛用于通用计算任务,如操作系统管理、应用程序执行、数据处理等。
GPU主要用于图形渲染、科学计算、机器学习和深度学习等需要大规模并行计算的领域。
总的来说,CPU和GPU在设计和功能上针对不同类型的计算任务。CPU适合处理复杂的单线程任务和通用计算,而GPU适合处理大规模并行计算任务。
3
Ansys Mechanical中使用GPU加速的设置方法
Ansys Workbench平台下设置GPU加速的方法有两种:
方法一:在Workbench主界面的菜单中选择Tools→Options→Mechanical APDL→GPU Accelerator。
方法二:在Mechanical界面下,选择Home→Solve Process Setting→Advanced→Use GPU acceleration。
4
Ansys Mechanical中使用GPU加速的要求
系统必须满足以下要求才能在Mechanical APDL中使用GPU加速器功能。
用于模拟的计算机必须至少包含一个NVIDIA GPU卡。建议使用以下卡片:
当使用稀疏求解器或基于稀疏直接求解器的特征值求解器(例如,Block Lanczos或子空间)时,建议仅使用具有显著双精度性能(FP64)的NVIDIA GPU设备,以实现最佳性能。其中包括以下型号:
为了在大多数可以使用GPU的模拟中实现有意义的加速,建议使用具有至少16GB以上内存的NVIDIA GPU设备。
对于NVIDIA GPU,驱动程序版本必须为451.82或更新版本。为了在Windows上获得最佳性能,建议在使用Tesla系列GPU时使用TCC(Tesla Compute Cluster)驱动程序模式。使用此驱动程序模式时存在一些限制。有关如何设置此驱动程序模式和现有限制的更多详细信息,请查看GPU卡文档。
要使用不在推荐列表中的NVIDIA GPU设备,请设置以下环境变量:
ansgpuoverride=1
例如你希望使用较新的NVIDIA GPU,这些GPU在原来版本的ANSYS程序发布之后才有的,可以用这个环境变量设置来使用GPU加速。如果选择使用此环境变量,需要确保使用的NVIDIA GPU设备在双精度计算能力和内存方面都足够强大,以实现有意义的模拟加速。在CPU功率不足的情况下使用此环境变量实际上可能会降低模拟速度。
注意:在Windows上,使用远程桌面可能会禁用GPU设备的使用。当RSM作为服务安装时,通过ANSYS远程求解管理器(RSM)启动Mechanical APDL也可能禁用GPU的使用。在这两种情况下,不能使用GPU加速器功能。使用TCC((Tesla Compute Cluster)模式可以规避此限制。
E
N
D