仿真工程师在学习和工作之中都希望能有一台性能强悍的计算机,让自己能够快速的完成各种仿真方案的验证或者仿真计算任务,但大多数工程师对电脑都不太熟悉,本文将分析各种仿真对硬件的需求,并对硬件的选择提供相应的建议。
关键词:仿真软件、ANSYS、电脑配置、硬件
本文要点:
1、仿真软件对硬件的需求
2、仿真电脑配置建议
一
硬件对仿真的影响
01
CPU
通常而言,ANSYS软件速度随着CPU的核数和时钟频率(主频)递增;但在选择硬件配置时,不应当一味的追求CPU的核数,还需要注意CPU的主频,核数相同的情况下,肯定首选高频率的CPU;一般而言,8~12核的CPU的核数与主频的平衡性较佳,若是预算充足的话,也可以买更多核数且主频较高的CPU。关于CPU,有超线程和超频这两个对仿真速度影响较大的技术,具体影响如下。
01)
超线程
超线程技术可以将一个物理处理器当作两个逻辑处理器使用,但是这并不意味着物理上存在两个逻辑处理器,因此并不能实现计算速度的加倍。
超线程将逻辑核数加倍,每个线程的速度却约为原来的一半,在进行大规模计算的时候下降会更加明显。这种超线程技术类似于:大卡车原来只有一个车斗,能装10吨,可以跑到100KM/h,但是超线程技术相当于给大卡车再多加一个车斗拖着,相当于把一辆大卡车当两辆来用,可以装20吨了,但是跑起来的速度却只有50KM/h。
所以求解器通常再关闭超线程时性能更好,因为物理核数(而不是逻辑核数)与浮点运算关系最大。并且更多的线程意味着需要更多的HPC License,即上一篇文章说的许可文件。同时建议在仿真时不要占用全部的物理核数,留下2个核数不使用可以使仿真速度更快。
图 1 关闭超线程计算速度更快(图片来源:ANSYS官网)
02)
CPU超频
英特尔睿频加速技术(Turbo Boost),这项技术可以理解为自动超频,当开启Turbo加速之后,CPU会根据当前的任务自动调整CPU主频,从而发挥最大的性能,轻任务时发挥最大节能优势。但是这个技术在使用核数较少时会有较大作用,但在使用核数较多时,不如核数与高速大内存的作用来得明显,因此尽量选择高基准频率的CPU更好。
02
内存
内存有SMP(共享式内存并行)和DMP(分布式内存并行)。
单机并行(SMP)系统共享单个全局内存,可看做物理分布于多个内核,但仍是全局寻址
图 2 共享式内存(SMP)
分布式内存并行处理(DMP)假定每个处理器的物理内存是独立于其他处理器的,这类系统的并行处理需要某种形式的消息传递软件,在多个内核之间交换数据,多机并行(多个电脑同时计算一个任务)肯定采用DMP。
图 3 分布式内存并行处理(DMP)
内存对仿真的影响有以下几点:
1、内存总量越大,可求解问题的规模就越大。
2、在仿真运算过程中,CPU需要与内存间进行大量数据的存取(I/O),内存带宽越宽,速度越快。带宽就像是高速公路,高速公路越宽,车道数越多,肯定车流量越大嘛,所以能用DDR5的内存肯定不用DDR4、DDR3的,能用5600MHz的肯定不用4800MHz的。
3、所有内存通道工作在最高速率,每块CPU应配备等量的内存。也就是说,例如在双路主板中安装了两颗CPU,当一颗配备了32G*8=256G的内存,那么另一块CPU也需要配置32G*8=256G的内存,如果一颗配的是32G*8的,另一颗配的是64G*4或者32G*4的内存,则工作速率不是32G*8的8通道工作速率,而是较低的4通道工作速率。
4、每个CPU内核配备8GB左右内存最佳。但根据个人或企业的经济实力,有时候每核4G也是可以的,后期不够可以加。
03
硬盘
在仿真过程中,需要频繁向硬盘存取数据,主要包括Temp和Result文件,因此主运算硬盘(计算时仿真文件放置的硬盘)尽量选用速度快的硬盘,固态硬盘(SSD)优于机械硬盘(HDD),同时内存越大,同时需要存取的文件越多,越需要高速硬盘。
图 4 硬盘对软件加速性能的影响(图片来源:ANSYS官网)
04
GPU
显卡的性能主要对ANSYS软件的前后处理过程中的图形显示速度与效果起作用,对计算过程没有影响,GPU起作用的地方有:复杂模型的交互操作、大规模网格显示效果、动态场图生成与显示。
GPU拥有数以千计的核心,擅长浮点运算,可以高效的处理并行任务,而CPU除了负责浮点运算外,还有很多指令集负载,运算功能更丰富,结构更复杂,但核心数不多。是否支持GPU加速,与算法求解的数据相关性、数据结构的复杂程度有关。
对ANSYS2023R1支持GPU加速的显卡如下:
AMD InstinctTM:MI100、MI210、MI250、MI250X
NVIDIA:A10、A16、A30、A40、A100
NVIDIA RTX:A4000、A5000、A6000
NVIDIA Tesla Series任何型号
NVIDIA Quadro: RTX6000、RTX8000、GV100、GP100
ANSYS各软件对显卡的选择可以参考下图:
图 5 ANSYS软件显卡的选择(图片来源:ANSYS官网)
二
不同仿真软件对硬件的需求
01
ANSYS Mechanical
ANSYS Mechanical对于CPU要求有多的核数和高的基准频率,同时运行时需要关闭超线程才能起到多核加速的效果。但多核加速在Mechanical中一般20核就会达到加速的极限,也就是说一个工作任务启用20核并行加速计算和40核并行加速计算是差不多的。
对于内存,自然是越多越好,硬盘容量也是越大越好,且尽量使用固态硬盘。
02
ANSYS Fluent/CFX
Fluent/CFX这样的流体仿真软件中的核心缩放非常好,因此关注核心*频率=有效频率,有些人偏向于频率,但小编偏向于堆CPU的核数,毕竟频率最高就那么高,但核数,一台电脑就能堆到256核去。而流体仿真多核加速基本没有限制,仿真文件足够大的时候40核的加速几乎就是20核加速的两倍。
内存也是每核4~8G,硬盘自然还是越大越好,使用固态最佳。
03
ANSYS EM
ANSYS EM中包含了MAXWELL 2D、3D,HFSS等电磁仿真软件,电磁仿真对CPU的频率要求较高,因此需要选择基准频率较高的CPU,一般电磁仿真的多核并行加速在12核左右就会到达极限。
内存也是每核4~8G,硬盘自然还是越大越好,使用固态最佳。
三
仿真电脑配置推荐
处于不同阶段的仿真使用的仿真计算机配置如图6所示。
图 6 不同规模的仿真使用的仿真计算机(图片来源:ANSYS官网)
01
入门级仿真计算机
若是初学者学习使用的电脑,一般只会运行一个工作任务,因此对于初学者而言,CPU选择当年的因特尔酷睿系列或者AMD的锐龙R系列的就能满足要求。内存的话固态2T,500GC盘做系统盘,500G做软件安装盘,1个T做仿真运行文件的放置盘,再加4个T的机械做仿真文件备份盘以及个人文件存储盘。
若是个人使用笔记本电脑学习仿真的,当前各大电脑厂商的游戏本基本能够满足使用需求,2023年CPU外游戏本基本配置为当年最新的因特尔酷睿系列移动桌面级CPU或AMD的锐龙R系列CPU,8*2=16G内存+1T固态的形式,GPU为英伟达的GeForce RTX系列显卡,个人根据经济情况选择CPU和GPU,内存可以加到 16*2=32G或8+32=40G或32*2=64G,硬盘加2T到达3个T的固态。
各大厂商的游戏本主要有:联想的拯救者系列、惠普的暗影精灵和光影精灵系列、戴尔的游匣系列、神州的战神系列、华硕天选系列、宏碁掠夺者系列等,价格5000~10000不等。
小编自己学习用的笔记本为联想拯救者Y9000P 2022款,配置:CPU为酷睿i9 12900H,GPU为NVIDIA GeForce RTX 3060,内存为镁光的DDR5 32*2=64G(拆了自带的8*2=16G),硬盘都是固态硬盘(现在的游戏本加不了机械硬盘):0.5(自带)+2(自己加的)=2.5T这一套在2023年一月花费1.1W。
如果需要加内存条和硬盘的,新电脑最好到售后去让专业人员帮加,大多数售后都是免费的。
02
小型企业用仿真计算机
对于小企业、个人仿真工作室、刚开始建立仿真能力的公司而言,仿真需求量实际也不大,任务也不繁重,使用工作站或者服务器作为仿真设备即可。这些企业或工作室一般会同时运行三到五个仿真任务,这时需要用到较多的核数,因此选择因特尔的至强金牌、银牌中核数较多的一般32核或64核的CPU或者AMD霄龙系列CPU,基准频率最好3GHz以上,三级缓存64Mb以上,GPU根据上一节的选配,硬盘仍是2T固态加4T或8T机械。
小编所在的公司需要进行电磁仿真、结构仿真、热分析以及耦合仿真,结构、电磁、流体都需要考虑到。所以给当前工作的公司配置的仿真服务器配置如下:
CPU:AMD霄龙9554(64核、3.1GHz基准频率、三级缓存256Mb、TDP 360W
GPU:NVIDIA A2000 6G(因为公司对价格有要求,所以牺牲了显卡性能)
内存:DDR5 RECC 4800MHz 64*4
主板:华硕 RS7720A-E12-RS12双路主板(只用了一路,选双路主要是方便后期升级,节约企业的成本)
硬盘:3T固态(服务器的固态比较贵,且加之公司有后端存储,所以就没买机械硬盘)
其他:主要是和公司后端存储连接的零件
这一套在2023年9月花费了7W。
03
大规模仿真
对于大型企业或需要进行大规模仿真的实验室而言,需要用到大规模HPC集群甚至更大规模的数据中心,但这种HPC集群或者数据中心需要专门的HPC平台来支撑CPU内核的调用与分配,这里不多做过多的讲解。