首页/文章/ 详情

CFD高性能数值计算与大数据技术

8月前浏览7174

文一:

 

计算流体动力学的未来方向

摘要:

在过去的十五年里,计算流体动力学(CFD)一直处于平稳状态。由于目前的生成方法无法准确预测湍流分离流的动力学,CFD的可靠使用仅限于操作设计空间的一个小区域。在本文中,我们将大涡模拟作为扩展CFD包络的一种方法。作为其中的一部分,我们概述了必须克服的几个关键挑战,以便在行业内采用它。我们将解决的具体问题包括异构大规模并行计算硬件的影响,对新的和新颖的数值算法的需求,以及方法及其各自实现的日益复杂的性质。

 

图:使用AIRPLANE代码计算的空客A320。

 

图:流体流动模型的层次结构

 

t图:CFD在空客A380设计中的应用。

 

图:动静脉瘘内生物流动模拟的流速大小着色流线的时间快照。

文二:

 

湍流建模和模拟策略

摘要:

这是为了澄清和确定湍流的数值预测可能的许多水平,目标是完整的飞机、涡轮机或汽车。并非所有作者的观点都会被接受,但他希望能激发反思、讨论和计划。这些水平的范围仍然从稳态雷诺平均纳维±斯托克斯(RANS)方程的解到直接数值模拟,其间有大涡模拟。然而,近年来增加了被称为“VLES”、“URANS”和“DES”的中间策略。它们正在实验中使用,尽管更昂贵,但威胁到复杂的RANS模型,尤其是对于黑体和类似的物体。空气动力学中的湍流预测面临两个主要挑战:(I)边界层的生长和分离,以及(II)分离后的动量传递。(I) 更简单,但要求非常高的精度,并且似乎给更高复杂性的模型带来的优势很小。(II) 现在是复杂RANS模型和更新策略的舞台,通过这些策略,时间相关的三维模拟即使在二维几何结构上也是常态。在某些策略中,grid re®nement旨在提高数值精度;在其他方面,它的目标是更丰富的湍流物理。在一些方法中,即使网格非常小,经验常数也发挥着重要作用;在其他人身上,他们的作用消失了。几十年来,实际的方法必然是RANS,可能是不稳定的,或者是RANS/LES的混合,纯LES是不可排序的。他们的精神内容将保持实质性,隔离墙的法律将特别具有抵抗力。根据计算能力的增长,对每种策略应用于全面的空气动力学计算所需的电网解决方案进行估计,并对其可行性日期进行粗略估计。

 

图:用各种方法模拟圆柱体的过流

文三:

 

协同CPU和GPU在天河一号A超级计算机上进行复杂网格的大规模高阶CFD模拟

摘要:

编程和优化当前多核加速HPC系统上复杂的,现实世界中的CFD代码非常具有挑战性,尤其是在协作CPU和加速器以充分利用异质系统的潜力时。在本文中,我们使用MPI + OpenMP + CUDA的三级混合和异质编程模型,我们在GPU加速的Tianhe-1A Supercuter上移植并优化了高阶多块结构性CFD软件Hosta。Hosta采用了两个自我开发的高级紧凑型差异方案WCN和HDC,它们可以用复杂的几何形状模拟流。我们提出了一种双级并行化方案,用于在GPU上有效地进行多块计算,并对高阶CFD方案执行特定的内核优化。当将一个Tesla M2050 GPU与两个Xeon X5670 CPU进行比较时,仅GPU的方法可达到约1.3的速度。为了实现更大的加速,我们协作CPU和GPU就hosta进行了协作,而不是使用幼稚的GPU方法。我们提出了一个新的方案,以平衡售货人贫乏的GPU和富含商店的CPU之间的负载。考虑到CPU和GPU负载余额,我们将Hosta的最大模拟问题大小提高了2.3倍,与仅GPU方法相比,协作方法可以提高性能约45%。此外,为了扩展田纳he-1A的昆虫,我们提出了一个聚集/分散优化,以最大程度地减少3D网格块的幽灵和奇异性数据的PCI-E数据传输时间,并尽可能地使用一些高级CUDA重叠协作计算和通信和MPI功能。可伸缩性测试表明,Hosta可以在1024 Tianhe-1a节点上实现超过60%的平行效率。通过我们的方法,我们成功地模拟了一个含有800m牢房的EET高移动机翼配置,并且中国的大型民用飞机构型含有150m电池。据我们所知,这些是最大规模的CPU-GPU协作模拟,可以通过复杂的配置和高级方案解决现实的CFD问题。

 

图:HOSTA流程图。还显示了一些实现这些步骤的子程序。

 

图:MPI + OpenMP + CUDA并行化的总体域分解。网格块首先分布在MPI过程/节点之间,然后在每个节点上进一步分配CPU和GPU。

 

图:重叠协作CPU–GPU计算和通信

 

图:瞬时涡旋结构的速度梯度张量第二不变量的等值面。

文四:

 

适用于任意网格的大规模并行CFD计算框架PHengLEI

摘要:

针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格。为了实现并行通信与网格类型无关且与物理求解器开发者隔离,我们设计了通用的通信模式和一种基于网格块的“三合一”的数据交换模式,即将多块结构网格块、并行分区网格块和结构/非结构网格块间的交界面数据完全标准化为数据底层后,在数据底层统一进行交换,使得数据交换不依赖于网格类型和数据类型,从而实现任意网格类型并行通信模式的统一。作为气动数据生产的“数值风洞”,要求代码将并行隔离至底层,为此针对主流计算机系统的特点,设计了粗粒度MPI/OpenMP混合并行模式,领域专家只需关注求解器开发而无需关注并行通信,在提高可移植性、可扩展性的同时尽可能兼顾封装性。针对大规模并行计算的实际工程需求,设计了并行分区、大规模并行文件存储模式,以缩短前置处理和文件I/O时间。最后,分别基于结构网格、非结构网格和重叠网格,给出了工程应用领域的标模算例,以说明PHengLEI并行计算框架对不同网格类型的适应性。大规模网格测试结果表明,国产定制集群上l6.38万核并行效率达83%以上,“天河二号”上近10万核并行效率达95%以上,展现了较好的可扩展性和并行计算效率。

 

图:结构网格分区过程:贪婪算法

 

图:客机物面并行分区

 

图:底层数据通信

 

图:并行文件分组存储

文五:

 

基于特征的流场数据挖掘

摘要:

将数据挖掘技术应用于流场分析,有可能挖掘出常规数值方法难以发现的复杂流动规律。流场数据与传统数据库数据不同。通常组织为不规则的空间离散点和单元。为建立流场数据挖掘的统一范式。提出了基于特征的流场数据挖掘流程,并设计了两类相应的数据模型组织方式:邻域时空盒模型和连接图模型。使用该框架,对特定Rayleigh-13enard对流现象的数值计算结果进行了关联规则分析。其中涡特征提取使用k准则,关联规则提取使用Apriori算法。实验挖掘到了一些非平凡的流场规则,证明了该方法的有效性。

 

图:基于特征的流场数据挖掘流程

 

图:RBC模拟结果的涡特征提取

 

图:规则4在流场中心点删平面上的可视化验证

来源:STEM与计算机方法
HPC湍流通用汽车通信理论自动驾驶数字孪生物流人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2024-03-03
最近编辑:8月前
江野
博士 等春风得意,等时间嘉许。
获赞 47粉丝 43文章 307课程 0
点赞
收藏
未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习 福利任务 兑换礼品
下载APP
联系我们
帮助与反馈