首页/文章/ 详情

ANSYS HFSS 高性能计算(HPC)的算法

1年前浏览7587

ANSYS HFSS HPC 的算法

HFSS软件核心的技术主要包括四大方面:GUI、Mesh、Solvers、HPC。本期主要从HPC性能、算法等方面进行详细介绍。

为什么HFSS需要用到HPC高性能分析?

最开始学习HFSS软件的用户,多集中在个人电脑上。随着产品密度提升、周期缩短,计算复杂度、计算速度要求越来越高,个人电脑已经无法满足高密度的计算能力,我们需要借助于更大内存或多CPU的工作站或服务器。这些工作站或服务器的CPU能够达到几十核,内存达到几百G,或者更高一点的到T级别。

对于更大一些的企业,则更倾向于配备计算机集群,这样的集群可支持更多的内存核数,也可支持更多的计算机用户。

HPC功能是软件借助于硬件的能力,使仿真能够达到更快、更大的计算能力。也就是说,HPC是独立于硬件能力的软件功能,必须在硬件达到一定核数和内存的前提下才能使用。

另外,大家在关注HPC速度和规模能力时,很容易忽视HPC高保真度的能力。在突破了更快速度更大规模的能力后,我们就可以将更多的精力用来追求更高的保真度。以前为了减小对内存的要求,我们将模型进行了很多的简化处理;现在我们就可以考虑更多的细节,更准确的结构,从而提高仿真的保真度。

接下来我们从更快速度、更大规模、更高保真度三方面来扩展介绍HPC的价值。


1


     

HFSS+HPC=Faster


   


    

HPC利用多处理器或内核来加速求解进程,主要技术包括:多线程、频谱分解法(SDM)、分布式transient。多线程就是我们最常使用的利用多处理器来求解,主要用于单个工作站。

  • 多线程可以用在初始网格生成、直接法求解、迭代法求解以及最终的场查看,也就是从前处理到后处理中都可以采用。一般8核的HPC,速度可提升近5.6倍。

  • 频谱分解法,主要用在扫频计算中,以往的扫频过程,一个频点接一个频点计算,频点越多所需要的时间越多,可认为是串行计算。而频域分解法,可以将局域网内的所有计算机都用来做频域计算,同时还可以将每个频点继续用多核处理器计算,即多核+SDM两种方式并用,其速度可以大幅显著增加。SDM技术支持离散扫频和插值扫频两种扫频方式。

  • Transient分布式并行求解,Transient时域算法对端口的数量非常敏感,整个计算时间以及内存消耗与端口激励数量有直接关系,时域算法中对每个端口单独进行求解,而频域算法对端口数量并不是特别明显。因此在瞬态仿真中采用分布式并行的方法,即把每个端口的激励分布在局域网上的不同计算机上,同时每个激励还可以继续用多核处理器计算。在新版本中,Transient还支持GPU加速。


2


     

HFSS+HPC=Bigger


   



HPC将仿真分布到多台计算机上,突破单一计算机资源限制,增大求解规模。主要技术包括:分布式内存直接法矩阵求解器、有限元区域分解法DDM、积分方程区域分解法IE DDM、混合算法并行、周期性结构域分解PDM。

  • 分布式内存直接法矩阵求解器,在HFSS有限元计算中,会得到一个很大的矩阵,然后通过矩阵两端求逆的方式得到未知量的矩阵的结果。分布式求解器将这个矩阵分布到不同节点上去计算,同时每个节点上还可以继续用多核处理器计算。对于多端口大型问题的求解适合用分布式内存直接法求解,因此此时端口非常多,端口之间的耦合非常强,运算量会非常大,用分布式计算可以大幅度显著提高求解速度。

  • 有限元区域分解法(FEM DDM),主要应用于有限元算法中。我们知道,有限元是基于体网格,网格量越多未知量越多,所需要的计算机的资源越大。区域分解法将问题域的网格分配到局域网的不同计算机节点上,计算机之间通过网线、板卡等业界标准的MPI技术进行数据间的交互。每个子域采用多个前端直接求解器求解,子域之间的信息交换通过域间迭代来进行,区域分解是完全自动化的,不需要人为干预。积分方程(矩量法)区域分解法(HFSS-IE DDM),这种方法是基于矩阵的,与前面基于网格的DDM有些差异,因为在积分方程求解法中采用面网格,并且数据之间是非稀疏矩阵,数据之间的紧密性非常大,无法使用网格进行剖分,只能把大的矩阵分配到不同的计算机的节点上进行计算,与FEM DDM的思路相同,但其算法有非常大的差异。积分方程法中的区域分解与FEM DDM也有很多相似性,比如采用标准的MPI进行数据之间的交互,可与MT相结合等。

  • FEM DDM+IE DDM混合算法并行,是HFSS HPC的一个很大的突破,两种算法之间可以进行优势互补,也可以进行并行计算。下图示例为车辆中坐了一个人,同时人在操作计算机。人和计算机是一种介质,适合用有限元法求解,车体可以设置IE region,用积分方程法进行计算,外部空气盒表面可以通过FEBI边界设置成IE region。每个区域分别使用DDM方法,比如人和计算机使用有限元DDM进行区域划分,车体通过积分方程DDM进行区域划分。

  • 周期性结构域分解(PDM),是求解有限大阵列问题中一个非常大的突破,该方法是将一个阵列中的不同单元分配到不同计算机节点上进行计算。该算法适合于求解超大规模的阵列,例如一个包含500多个波导单元的阵列,每个波导单元有2个求解模式,一共有1000个求解模式,利用周期性结构域分解方法可以达到快速求解的目的。


3


     

HFSS+HPC=更高保真度


   



更大规模的仿真已经不是问题,采用包含结构细节的真实模型,进行更广泛的参数优化变得愈加重要。采用HPC意味着不必为设计指标进行妥协,快速求解,能够让我们做得更多更快。

跟高保真度相关的算法主要是DSO分布式计算,DSO是与优化模块(Optimetrics)配合的一个模块。在传统的参数化计算中,都是采用串行的计算,计算完一个参数后再计算下一个参数。利用DSO方法,可以将每个变量分配到不同的计算机节点上,基本可以达到线性的提速,比如32个参数节点利用DSO方法大概能提升27倍速度。该算法同样适合于Maxwell、Designer、Q3D Extractor、Simplorer等EBU模块。


   

   


上海艾羽信息科技有限公司是一个以CAE软件销售、技术咨询及服务,仿真咨询及规划布局为一体的高科技公司。

作为ANSYS的合作伙伴,艾羽致力于将ANSYS推出的产品,通过业界性能颇佳、颇丰富的工程仿真软件产品组合帮助客户解决复杂的仿真难题。力求与ANSYS一起,共同为中国制造业提供先进的仿真技术,通过仿真技术支撑中国2025。


来源:艾羽科技
MaxwellHFSSQ3D ExtractorHPC参数优化ANSYS
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2023-04-29
最近编辑:1年前
获赞 28粉丝 68文章 115课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈