并行加速技术是随着计算机技术发展而不断进化演变的。基本的HPC演变路径可参考下图的描述,从桌面到工作站/服务器,再到集群/云计算。针对不同级别的应用场景,需要不同的HPC技术来支持该应用环境。
由于这里是回顾历史,所以会涉及到比较早的现在已经淘汰掉的并行技术,如MP技术。粗略的看,HFSS的并行计算使用方式可参考下图的选择流程。
最简单易用的并行技术,早期HFSS必配选项之一,即利用计算机的多个核心,并行求解单个任务的功能。随着技术的进步,已经被HPC取代。
该加速技术可简单的描述为利用冗余计算机资源,同时计算多个任务,达到计算加速目的的并行加速方式。其原理可简要的用下面的图来描述。
这种加速方法在微波器件,天线单元等设计参数扫描优化,统计分析等设计空间探索方面具有非常巨大的应用空间。
该技术的更高级形式是结合设计空间探索工具,如DesignXplorer或optiSlang等工具,实现大规模的参数空间设计探索。
该方法自动将宽带扫频频点分配到多个处理器或计算机求解,自动生成扫频结果,可极大减少了宽带频域求解的总仿真时间。
域分解技术是HFSS求解技术的一个里程碑式的跨越,其基本思想是将子域网格分配到网络中的各个计算节点上,利用多个节点的计算资源来共同完成一个大型的计算任务。随着近十年来的技术研发,DDM技术已经形成了成熟的体系和高效的算法效能,可实现不同算法,不同算法内部的分区求解,以及特定类型的域分解求解,如针对周期结构的有限大阵列方法。
DDM技术支持多种运算平台,包括HPC平台、多计算机组网及单机多域并行求解,可显著提升求解问题规模。能够高效的利用到数量众多的处理器,全自动任务分解和负载均衡,支持迭代法/直接法混合矩阵求解技术。
至于DDM的专门技术,包括有限大阵列域分解算法,以及三维部件域分解技术,请参考第2节的对应部分,这里不再赘述。
将多个激励分布到多个节点并行求解,加快HFSS-TR瞬态求解的速度。结合 HPC-MT(多进程并行),可进一步提高速度。
该技术是利用GPU加速提升求解速度。
² FEM+GPU 加速复杂矩阵计算
² Savant (SBR+)+GPU 可提速上百倍
² TR+GPU 加速大规模问题求解
具有复杂频率响应的大型模型,用HPC 128求解。
l 2019 S参数仅求解模式,节省5倍内存
l 2019 版比HFSS 14版快4.3倍
以Galileo测试板为例,频率扫描加速6.2倍,总计加速2.4倍,HPC 128加速38倍。
HPC 增加层级,先分布式变量,然后再并行求解变量任务,或用新的分布式直接法矩阵求解。或者,先分布式频点,然后DDM 或新的分布式直接法矩阵求解单频点任务。
ANSYS已经与云合作伙伴共同推出仿真云解决方案。