首页/文章/ 详情

BAE:机器学习加速CFD模拟在建筑环境领域的应用研究

1月前浏览408
SIMPOP
 

摘要  

计算流体力学(CFD)是设计建筑环境的有价值工具,可增强室内外应用的舒适度、健康、能效和安全。然而,工程研究中CFD计算所需的时间仍需缩短。机器学习(ML)技术的最新进展为开发快速运行的数据驱动模型提供了一条有前景的途径,以处理与物理相关的现象。随着科学机器学习(SciML)研究日益关注ML与CFD技术的高效耦合,本文综述强调了在建筑环境领域加速CFD模拟应用数量的增长。这项工作旨在识别将ML技术纳入建筑环境流动模拟中的新兴趋势和挑战,以推动该领域的进一步发展。主要方法是直接替代建模和简化阶次模型(ROM)。这两种方法越来越依赖基于神经网络的深度学习架构。所审查的研究报告了在特定场景中计算时间的几个数量级的提升,同时保持了合理的准确性。然而,还有几个挑战需要解决,如提高模型的通用性和可解释性,增强方法的可扩展性,以及降低开发模型的计算成本。正在进行的努力旨在使用先进的SciML技术处理更复杂的案例。值得注意的是,将物理知识融入学习过程和与数据驱动模型的CFD求解器的混合化需要进一步研究。探索这些方法是实现可靠模型部署的关键步骤,这些模型能够为建筑环境工程研究快速设计提供支持。  
 
 

1.引言

计算流体力学(CFD)技术已经发展了几十年,用于基于计算机模拟分析复杂的流体相关现象。这种数值方法具有巨大的潜力,尤其是在工业需求方面,因为它有助于避免或减少实验程序。实际上,进行实验可能会非常昂贵、耗时、设置困难,并且很难准确监测。此外,CFD方法能够产生比手工计算或简化模型更精细的结果。这使得CFD成为一种非常有价值的补充工具。

随着计算能力的持续增长,CFD变得更加经济实惠,且被广泛应用。科学家们以更高的精度应对越来越复杂的系统,提升了我们对先进物理现象的理解。模拟支持复杂系统的设计,并为决策或性能优化提供关键元素。然而,尽管CFD代码已经取得了长足的进展,但它们仍在不断成熟和发展。CFD方法有许多方面可以改进,包括湍流模型、多物理场问题和数值方法。一个主要挑战是解决大规模现实问题所需的计算时间。
建筑设计也不例外,面临计算成本瓶颈,因为工程研究通常涉及较大的计算域和湍流。由于涉及的因素多样,如具体问题、建模假设、使用的CFD代码以及可用的计算资源,因此很难提供精确的计算时间来支持这一论点。然而,对于单次模拟的建筑工程研究,提供一个实际的时间范围是可能的,通常从几个小时到几周不等。
人工智能(AI)在过去几年中取得了显著的增长。大量数据和增加的计算能力揭示了机器学习(ML)算法的全部潜力。除了能够识别数据中的模式并准确逼近复杂函数外,机器学习模型在计算时间上可能相较于传统算法(如基于高保真物理模型的算法)提供显著优势。尽管机器学习模型的训练阶段可能非常耗时,但它们在进行新预测时非常高效(即推理时间很短)。
研究如何将CFD工具与AI结合以加速计算是一个自然的进展。然而,将基于物理的数值模型与机器学习结合仍然面临许多需要克服的挑战。如何在保持结果可靠性的同时利用AI加速CFD模拟,这一研究问题仍未解决。一个简单的解决方案是用机器学习模型替代物理模型(即直接替代建模),但这种策略可能会导致非物理解和较差的泛化能力。当前的研究正在致力于通过AI增强CFD,并使数据驱动模型能够应对现实世界中的流体动力学挑战。主要目标是强化基础物理学,并提高模型的泛化能力、鲁棒性和数据效率。
加速CFD计算将是改善建筑设计的重要一步。为了走这条道路,我们提出了一篇综述,回顾了最近的进展和尝试,探讨如何利用机器学习算法加速建筑环境CFD模拟。我们提供了一份最新的综合分析,据我们所知,现有文献中尚未涉及。鉴于机器学习的快速发展以及其应用中的众多未协调的方法,我们认为这项工作是必要的。因此,本综述的三个主要目标如下:首先,(i) 我们确定加速建筑环境CFD模拟的机器学习技术的新兴趋势和挑战。然后,(ii) 我们识别建筑领域之外的进展,以弥合科学机器学习(SciML)与建筑环境工程之间的差距。最后,(iii) 本综述具有教学意义,旨在连接建筑环境与机器学习这两个看似遥远的领域。
在本综述中,第2节概述了CFD在建筑环境工程中的应用,并讨论了CFD计算成本的挑战。第3节介绍了机器学习的基础知识,概述了理解科学机器学习(SciML)趋势的关键概念。我们特意强调深度学习,因为它在所审阅的文章中广泛应用。第4节重点讨论了当前利用机器学习算法加速CFD的策略。因此,前述各节为深入审视当前在加速建筑环境CFD模拟方面的研究工作提供了基础。第5节对这一特定综述进行了详细讨论,随后是结论部分。

2. 建筑工程中的计算流体力学

2.1 建筑物的主要CFD应用
大多数建筑环境中的CFD应用涉及舒适性、健康、能效或安全[6]。这些应用涵盖了室内(图1)和室外(图2)流动,且在不同的尺度上进行分析。在室内应用中,重点是研究建筑物内的空气流动,考虑通风、温度梯度和污染物存在等因素。确保居住者的热舒适性和维持令人满意的室内空气质量(IAQ)是关键优先事项。此外,预测烟雾传播对火灾风险评估至关重要。室外模拟研究建筑环境中的外部气流行为。这类分析可以为城市设计的各个方面提供重要见解,包括行人舒适度、自然通风潜力、风荷载、城市热环境和污染物扩散。CFD工具可以帮助研究所有这些主题。特别是,CFD可以准确识别流动模式,这有可能改善建筑设计。
2.2 尽管简化了,建筑CFD模拟的计算时间问题
2.2.1 建筑工程中的传统CFD方法
解决CFD问题的标准数值方法包括两个主要阶段:预处理和求解[2]。特别是在预处理阶段,感兴趣的区域被网格化(见图1),然后将基础方程离散化为一组代数方程,必须求解。由于在大多数情况下,完整复杂地求解控制方程是没有必要且低效的,因此建模人员需要决定哪些物理过程可以忽略,因为它们对分析结果的影响很小。对于大多数建筑应用,空气可以被视为等温不可压的牛顿流体。通常根据Boussinesq近似对方程进行调整,以涵盖涉及热传递的情况,例如舒适度研究。最终,为了处理复杂流动(如火灾安全研究中遇到的流动),需要更全面的方程版本和附加的复杂模型。
解决CFD问题的最自然方法是通过直接数值模拟(DNS)。使用细网格和小时间步长可以使求解器捕捉到流动的所有尺度,从而提供独特的基础性见解。然而,对于湍流的大规模现实问题,这种方法在计算上变得不可行。因此,DNS并不是建筑环境研究中的工程工具箱的一部分。
图1. CFD室内应用示例:房间的仿真结果(上)和网格(下)
图2. CFD室外应用示例:城市风场
 建筑仿真传统上依赖于雷诺平均纳维–斯托克斯(RANS)和大涡模拟(LES)方法,这些方法通过模型来避免求解所有湍流尺度。RANS方法将感兴趣的量(通常是速度、压力或温度)分解为均值和波动成分。由此得到的方程使我们能够求解均匀流动,同时对湍流波动的影响进行建模。另一方面,在LES中,对控制方程中涉及的量进行空间滤波操作。大涡的流体被显式求解,而小尺度的耗散效应(小于滤波尺寸,通常为网格尺寸)则通过模型来处理。因此,LES能够以DNS计算成本的一小部分提供湍流流动的时间依赖解。还有几种其他技术将LES和RANS策略相结合,但它们在建筑工程中尚未得到广泛应用。
毫无疑问,LES策略能够产生比RANS方法更准确的结果。然而,这也带来了计算时间的增加。由于为工程目的提供极高精度的CFD结果通常是不必要的,RANS仍然是建筑应用中最流行的方法。虽然通常假设均匀气流是静止的,但在某些情况下,考虑波动可能是必要的。例如,Yoshie等人承认,为了在预测建筑周围的风环境时获得更好的准确性,LES是理想的。最终,数值策略的选择取决于速度与精度之间的权衡。
2.2.2 计算时间瓶颈
即使采用简化的方法,如RANS或LES,计算时间仍然是CFD工程研究中的一个重大瓶颈。举个例子,即便使用专用超级计算机,对于建筑环境应用,单次LES模拟可能需要几天时间。评估大量配置超出了传统计算资源的能力。此外,Morozova等人估计,计算资源的增长不太可能足够使CFD成为建筑应用中日常使用的可行选择。因此,降低CFD计算成本是CFD社区未来的主要挑战。快速CFD方法的出现可能会改变决策过程,推动参数化和优化研究,从而实现更高效的设计。这个观点为探索创新方法提供了主要动机,例如机器学习,它代表了加速建筑环境CFD模拟的一个有前景的途径。
2.3 用简化模型替代CFD
为了实现更快的流动模拟,各种简化方法 正在不断开发和改进。例如,Xu等人提到了多孔介质模型、快速流体动力学、多区模型、格子Boltzmann方法或粗网格CFD。无论采用何种方法,模型简化不可避免地会减少某些配置的准确性。然而,当合理使用时,简化模型仍然是实现快速计算并提供有价值见解的强大方法,尽管它们不能完全替代传统的CFD方法。例如,Seifert等人证明,常用于风驱动通风分析的简化宏观方法能够为工程应用提供令人满意的结果。然而,根据建筑物的孔隙度和风向,结果可能会显著不准确。在另一种情况下,Hodges等人强调,火灾区模型无法预测复杂配置,并且可能缺乏进行危险分析所需的分辨率。
简化模型在过去几年中一直是广泛研究的主题。另一方面,最近关于机器学习方法的研究激增,这些方法可能为加速模拟提供突破。新的即插即用机器学习工具开始出现,特别是在城市风场建模方面。它们的目标是通过即时预测来革新早期设计。然而,由于缺乏关于性能和底层使用的机器学习方法的详细信息,这限制了进行全面评估的能力。我们认为,进行综述可以帮助澄清最近的进展。因此,我们的研究重点是机器学习技术,可能与传统方法相结合,以加速建筑环境CFD模拟。

3. 机器学习概述

3.1 机器学习方法

机器学习利用数据来洞察系统的行为,从而在科学领域开辟了广泛的潜在应用。机器学习框架的强大之处在于,它不需要事先了解底层系统的规律。此外,一旦学习阶段完成,模型几乎可以即时生成预测。回到我们的主题,这一优势可以被利用来加速流体力学中的计算。
机器学习算法通常根据数据中可用的信息和要提取的知识的性质分为三类:
(i) 在监督学习中,模型被训练来预测数据集中直接提供的特定结果,即标签。学习算法的目标是最小化损失函数,该函数量化了模型预测值与训练数据中目标值之间的差异(见图3)。
(ii) 相反,无监督学习从无标签数据中提取有关底层概率密度的信息,采用技术如聚类或降维。特别是后者在流体力学的机器学习中起着重要作用。编码器-解码器方案通过压缩数据来保留关键信息(见图4)。
(iii) 如其名所示,半监督学习桥接了无监督和监督方法,处理数据并非完全标记的情况。在流体动力学应用中,生成模型或强化学习通常属于这一类别。一个共同特点是,这些算法通过生成数据来提升自身的性能。
有大量的机器学习算法可供选择,包括线性模型、决策树、支持向量机(SVM)和神经网络,但没有哪种算法是普遍优越的。尽管机器学习技术并不新颖,但近年来的进展是显著的。这些进展主要归功于计算能力和可访问数据的大幅增加。
图3. 监督学习的示意图
图4. 编码器-解码器过程示意图,描述了降维过程 
3.2 深度学习的关注
如今,深度学习无疑是最流行的机器学习方法。在实践中,深度学习架构基于深度神经网络,能够逼近任何连续函数。神经网络处理大数据集的能力以及在图形处理单元(GPU)上进行高效训练的优势,使其具有明显的优势,推动了深度学习的普及。研究人员现在能够训练比几十年前更深的模型,推动了神经网络的极限。一个显著的突破是,深度学习能够处理原始数据,避免了为创建有用模型输入而进行特征工程的需求。然而,值得注意的是,即使深度学习在许多任务中非常高效,传统的数据驱动方法也不应被忽视。复杂模型也带来了诸如过拟合、泛化能力差、可解释性差和训练过程繁重等问题。
3.2.1 神经网络架构
全连接神经网络(FCNN)代表了深度学习中最基本的神经网络架构(图5)。然而,它并不总是最优选择,主要是由于随着网络规模的增大,参数数量显著增加。因此,稀疏连接网络应运而生,并且被证明非常有效。
卷积神经网络(CNNs)依赖于卷积层,通过离散卷积进行滤波(图6)。由于相比全连接神经网络(FCNNs)更易于训练且具有更好的泛化能力,CNNs已经成为不同领域中广泛采用的架构。循环神经网络(RNNs)能够成功处理时间序列等数据序列。它们通过设计在生成输出时保留序列中前一个元素的信息(图7)。然而,RNNs在训练时面临挑战,因为在优化过程中梯度往往会消失或爆炸。长短期记忆网络(LSTMs)通过引入显式的记忆来解决长期信息保留的问题,已被证明在处理长时间序列时更为高效。最近,处理数据序列的趋势从RNNs转向基于注意力机制的Transformer模型。图神经网络(GNNs)旨在将神经网络应用于图形形式的问题。对于基于物理的问题,这种框架提供了一种令人兴奋的方法,因为非结构化网格可以被视为一个图。通常,图神经网络通过消息传递机制实现信息在图元素(即节点和边)之间流动,图会根据接收到的邻域元素的信息进行迭代更新。

图5. 全连接神经网络(FCNN)示意图
神经元对输入组件进行线性组合,并应用最终的非线性激活函数以提供标量输出。它们按层排列,并通过连接形成一个全连接神经网络(FCNN)。
图6. 2D离散卷积示意图
4 × 4卷积核,无填充,步幅为1。卷积核对输入矩阵的所有补丁应用相同的操作序列。因此,卷积神经网络(CNNs)可以在不同位置识别相同的局部模式,同时使用相对较少的参数。
这一段仅提供了这个高度适应性框架内广泛可能性的一个狭窄视角。深度学习是一个快速发展的领域,导致了大量不同的思想被融入到这一通用概念中。例如,卷积神经网络(CNNs)通过引入扩散卷积神经网络(diffusion-convolutional neural networks),已经扩展到图形数据领域。这些网络随后被整合到递归神经网络(RNN)架构中,用于时空预测任务。
图7. 递归神经网络(RNN)示意图。7(a)展示了常见的递归表示。7(b)展示了在正向传播过程中,时间展开的图
对于序列中的每个元素,RNN提供的输出隐式地依赖于所有之前的元素。
3.2.2 物理学中的神经网络
科学机器学习(SciML)领域出现在科学计算与机器学习的交汇处,旨在利用数据科学改善数值建模。SciML的典型目标是构建与数据和控制方程一致的模型。在机器学习过程的各个阶段(包括网络架构和损失函数)整合物理学,确保模型符合物理原理,并且在不同程度上保证其准确性。预期的两个优势是提高模型的泛化能力和减少所需的训练数据。
在SciML中,最著名的技术之一无疑是物理信息神经网络(PINN)框架,它专门设计用于在训练过程中引入物理方程。方程残差和边界约束通常被加入到损失函数中(如图8所示)。虽然损失在统计上得到最小化,但不能保证残差为零。尽管文献中对PINN框架充满热情,Chuang和Barba指出,PINN框架尚未足够成熟,无法处理现实问题,也无法替代传统的CFD求解器。
神经算子架构,如深度算子网络(DeepONets)或傅里叶神经算子(FNOs),在求解偏微分方程方面正受到越来越多的关注。神经网络学习的是潜在的算子,即函数空间之间的映射,而不是离散表示。这产生了一个分辨率不变的解。尽管神经算子在许多实时推理应用中是领先的算法,但在应用于大型多物理场问题时,它们表现出显著的局限性。
图8. 物理信息神经网络(PINN)示意图
其他方法将基础物理编码到神经网络。特别是,神经常微分方程(NeuralODEs)架构将标准的常微分方程求解器与神经网络相结合。这种用于建模常微分方程的强大方法已被多种方式扩展。这些物理编码策略可能更难训练,但有潜力显著加速科学计算。

4. 使用机器学习加速计算流体动力学

随着机器学习的最新进展,流体力学界正积极探索如何利用这一潜力来改进计算流体动力学(CFD)。Vinuesa 和 Brunton 提出了将机器学习应用于加速 CFD 求解器的三类分类(图 9):(i)加速直接数值模拟(DNS),(ii)改进湍流模型,和(iii)开发降阶模型。这三条研究方向都能加速计算,这是本文的重点。

从工业角度来看,数据科学通过实施数字孪生技术,正在影响复杂工程系统的设计。机器学习模型可以丰富这些物理实体的虚拟表示,基于仿真和实验提供快速且可靠的预测。因此,正在探索新的范式,以生成能够提供接近实时预测的数字孪生,而无需进行额外的资源密集型 CFD 仿真。
最简单的方法是建立基于机器学习的替代模型来替代整个 CFD 仿真。虽然这种方法在特定应用中有效,但通常泛化能力较差。将物理知识引入机器学习模型以指导或约束模型(见第 3.2.2 节)是一种有前景的策略,有助于提升模型性能并确保生成物理一致的预测。因此,研究工作正在转向强化物理基础的数据驱动模型。
Vinuesa 和 Brunton正确指出,CFD 解算器已经优化了几十年,而机器学习与 CFD 的耦合仍然是一个新的前沿领域。如何高效地结合机器学习和 CFD 仍然不清楚,但似乎在短期内完全用机器学习取代 CFD 是不现实的。一个更实际的方法是探索它们如何协同工作。混合方法通常在计算时间上的改进不如纯粹的数据驱动方法那么显著,但它们在鲁棒性和泛化能力上表现得更好。例如,Jeon 等人实施了一种交叉耦合策略来加速长期的非稳态仿真。交替序列的 ML-CFD 成功地控制了连续机器学习模型预测中的误差积累。List 等人表明,展开训练轨迹的时间对动态系统的预测精度有重要影响,即求解器-在-回路方法。研究还强调了学习校正的重要性,其中模型学习纠正传统数值解算器,而不是取代其角色。另一种常见方法是粗略地网格化域,这会显著影响计算时间,并使用机器学习模型来缓解精度损失。这种技术被称为超分辨率。像不可压流体的泊松解算器等昂贵的 CFD 解算器子组件也是机器学习模型的合理目标。例如,模型预测可以改进预处理技术或作为迭代线性解算器的初始猜测。
图 9. 
图9根据 Vinuesa 和 Brunton的总结,机器学习(ML)可以增强计算流体力学(CFD)的几个相关领域。在本综述中,我们聚焦于使用机器学习加速仿真。我们强调,这三个类别(b、c 和 d)可以加速 CFD 计算。
除了前述方法外,还有一些其他举措通过针对仿真前处理步骤间接减少计算时间。例如,估计合理的边界条件(如入口流量)可以减少计算域的大小,从而影响计算时间。另一个有前景的加速途径是自动网格生成,这是一个特别耗时且需要专家知识的过程。
4.2 利用机器学习增强湍流模型
正如第2.2节所述,工程师主要依赖于RANS和LES方法。然而,湍流闭合模型可能过于简化流动行为,并且在特定应用中很难进行调优。因此,湍流建模是增强CFD的机器学习研究中的一个重要领域。数据驱动算法可以帮助将湍流模型校准到特定应用,学习闭合项的一部分,甚至提供完全基于机器学习的湍流模型。考虑到LES在壁面流动中的高计算成本(壁面流动在工程中很常见),一些研究尝试开发数据驱动的壁面模型来加速LES。更广泛地说,机器学习是一个强大且充满前景的方法,适用于各种流体流动模型,例如湍流、反应流动或多孔介质流动。
机器学习模型在这些情况下并不是主要为了减少计算时间。然而,改进的准确性可以拓宽低成本模拟(如RANS或壁面建模LES)的适用范围。需要注意的是,混合ML-CFD策略(如第4.1节所述)也可以加速像RANS和LES这样的流体动力学方法。例如,Obiols-Sales等人成功地将RANS稳态模拟与卷积神经网络(CNN)耦合,从而加速了收敛过程。
4.3 降阶模型与流动控制
降阶模型(ROMs)提供了复杂系统的低维、低保真度表示。第一步是识别一个合适的低维基,可以通过一系列降维技术来实现。接下来,目标是捕捉在降维基中表达的系统动力学。降阶模型有潜力将流体力学计算减少到实时流动近似。然而,这种加速是以应用范围的局限性为代价的。事实上,降阶模型通常是为特定的流动配置设计的,可能不具备良好的泛化能力。
适当正交分解(POD)是流体动力学中最广泛使用的技术之一,用于从流动快照中找到低维正交空间基。该基的组成部分,称为模态,具有所研究领域的维度。该线性方法具有物理可解释性,有助于提高我们对复杂流动的物理理解。POD模态通常按能量含量排序,前几个模态展示了主要的流动结构(图10)。POD的一个优势是,它允许选择包含在降阶基中的模态数量,从而调整模拟保真度与计算速度之间的权衡。Galerkin投影是将物理控制方程投影到模态上的常用方法。这个过程生成了一个新系统,可以比全阶模型更快地求解。然而,这个过程是侵入性的,即它需要明确的控制方程知识。
动态模态分解(DMD)是另一种常用的低维流动动力学模型构建方法。这种无模型的数据驱动技术将主要流动动力学捕捉到一组非正交模态中,并构建一个描述主流动随时间演化的线性模型。DMD和POD是互补的方法,但也有一些相似之处。它们都依赖于奇异值分解来构建最适合数据的线性模型。然而,DMD将每个模态与一个时间频率相关联,这对于周期性系统特别重要。许多方法的扩展(例如,高阶DMD,SINDy)已被实施,以提高降阶模型的逼近能力。
 图 10. Lattimer 等人使用适当正交分解(POD)创建了浮力羽流仿真的降阶模型(ROM)。
此图显示了前三个速度和温度模态(从左到右分别为1、2和3)对ROM的贡献。每个模态添加了不同层次的相干结构。
机器学习的进展为改进降阶建模策略提供了新的机会。一种现代方法是训练神经网络,将高维流动快照以非侵入的方式映射到低维潜在空间,例如使用自编码器(AEs)。非侵入式降阶模型(NIROMs)可以解决传统侵入式方法的主要限制。(i)NIROMs避免了在投影步骤中需要进行繁琐的CFD代码操作。(ii)它们可以通过非正交和非线性编码学习更紧凑的数据表示。(iii)像POD和DMD这样的线性方法在处理非线性问题时可能会遇到困难。现代机器学习技术还可以在捕捉流动的系统动态并将其表达在降维基中起到重要作用。具有特定架构的神经网络,例如LSTMs,被训练来预测流动的非线性时间演化。
POD、DMD 和其他降阶模型(ROMs)是处理流体流动控制任务的理想候选方法,其中模型响应性至关重要。还应注意,深度强化学习框架,它将深度神经网络引入强化学习过程中,也非常适合解决复杂的控制问题,例如与流体动力学相关的控制问题。

5. 面向建筑环境的AI加速CFD仿真

在他们的详细综述中,Calzolari 和 Liu探讨了深度学习在建筑环境应用中的计算流体力学分析潜力。他们观察到,大多数研究采用机器学习来替代成本高昂的 CFD 仿真,以实现快速预测。因此,他们在回顾建筑环境领域的研究时,重点关注了深度学习代理建模。作者强调,某些有前景的方法尚未在该领域得到充分探索,例如超分辨率、湍流模型增强或物理信息深度学习。我们认同这一观点,并认为弥合建筑环境领域与先进机器学习方法之间的鸿沟至关重要。
此外,亟需一篇互补的、更新的综述。当前部分全面分析了近期文献,以识别在加速建筑环境研究中的代理建模新兴趋势。接下来,我们将重点讨论降阶模型的最新进展。最后,我们描述了将机器学习集成到 CFD 解算器中的混合策略尝试。
5.1 建筑环境CFD应用的直接代理建模
Westermann和Evins指出,代理建模已经成为当前建筑性能模拟和优化研究中的一种普遍趋势。他们的文献综述集中在利用机器学习(ML)代理模型来改进可持续建筑设计。尽管这些结论对CFD代理模型也具有相关性,但值得注意的是,几乎所有列出的代理模型都面向不包含CFD代码的建筑模拟软件。作者确定了建筑设计过程中可以从快速代理模型中受益的四个阶段:(i) 概念设计,(ii) 设计优化,(iii) 敏感性分析,(iv) 不确定性分析。综述强调了在建筑设计优化任务中,利用代理模型可实现高达80%的计算时间加速,而不影响最优质量。然而,仍然存在一些挑战需要解决,特别是关于代理模型的泛化能力、可解释性和创建代理模型的计算成本。
如表1所示,许多近期研究已应用机器学习技术完全替代繁重的建筑环境CFD模拟。我们可以观察到,所有建筑应用(室内和室外)都属于这一趋势。
 表1
5.1.1 高层次指标的代理模型
CFD仿真通常用于获得感兴趣的高层次指标,既可以优化其值,也可以验证其是否满足特定标准。这些指标可以对应于全球性指数,例如热舒适度、污染浓度或空气更换效率。训练数据跟踪在各种仿真条件下高层次指标的变化,然后可以用于学习响应面。因此,这些模型通常学习将描述问题的几何特征和物理量(即输入)映射到聚合CFD仿真生成信息的性能指标(即输出)的函数。最常用的模型无疑是全连接神经网络和基于树的算法。
关于室内研究,Tian等人和Li等人训练了全连接神经网络(FCNN)来预测房间内的空气质量、热舒适度和能效表现。输出值包括诸如房间能耗、CO2浓度、空气年龄和热舒适度预测均值投票等指标。在相关的研究中,Ding和Lam提出推断一个新的指标,用于估计交叉通风潜力。类似地,室外CFD仿真可以预测风特性或污染物浓度,这些都是代理模型的常见目标。
5.1.2 空间场的代理模型
一些研究试图预测空间信息,而不是高层次的指标,以获得更为详细的结果,这通常与工程应用相关。
Kim 等人和 Shin 等人利用卷积神经网络 (CNN) 从图像中预测室内空气质量 (IAQ) 的空间分布。Zhou 和 Ooka以及 Quang 等人证明了全连接神经网络 (FCNN) 可以估计非等温情况下整个感兴趣区域的速度和温度分布。Hodges 等人、Lattimer 等人和 Su 等人开发了代理模型,用于估算建筑物内空间分布的温度、速度或烟雾可见度切片。转置卷积神经网络(非常适合上采样任务)被训练用于从高层次火灾场景描述生成图像,并且这一过程可以在不到一秒的时间内完成。它们在火灾安全工程中表现出良好的泛化能力,并且能够在可接受的准确度范围内进行预测。
关于户外应用,Javanroodi 等人使用全连接神经网络 (FCNN) 估计了任意城市形态下的局部风速或空气温度,取得了令人满意的准确度。Peng 等人开创性地将傅里叶神经算子 (FNOs) 应用于城市尺度的 3D 动态微气候模拟。这一 FNO 方法显著加速了模拟,误差率低于 1%,并且在不同风向下具有良好的泛化能力。Shao 等人提出了一个新颖的物理信息图神经网络模型(即结合了图神经网络 (GNN) 和物理信息神经网络 (PINN) 方法),用于城市风场的快速预测(图 11)。他们声称该模型满足低成本、可重复性、可靠精度、可扩展性和高性能的要求。然而,他们也承认,必须将其工作扩展到更复杂的场景。Huang 等人利用生成对抗网络 (GANs)作为代理模型来加速城市设计,在他们的研究中,这一方法的加速比超过了 100 倍。他们的研究涉及多个领域,如行人级别风速、热舒适度和积累太阳辐射。Glumac 等人和 Lamberti 与 Gorlé利用机器学习模型来确定建筑立面的压力系数。他们采用了多保真度方法,结合了低保真度的 RANS 和高保真度的 LES 数据。
图 11. Shao 等人提出的 PIGNN-CFD 架构
图神经网络 (GNN) 通过迭代计算下一个状态 (a)。编码器从输入图生成潜在图 (c),该图通过学习的消息传递步骤 (d) 进行更新,然后解码以在下一个时间步生成输出 (e)。在 GNN 架构中,训练好的神经网络处理图的一部分(即局部方法),但应用于整个领域以进行全局预测。因此,他们的模型可以扩展到任意大规模的城市场景。
Lin 等人使用全连接神经网络(FCNN)预测理想城市环境中的污染物扩散。通过将NO浓度的相对误差控制在20%以下,他们展示了替代模型可以在几秒钟内提供有价值的见解。类似地,Jurado 等人训练了几种基于卷积神经网络(CNN)的深度学习架构来预测空气传播的污染物扩散。他们通过使用 multiResUnet 架构获得了最佳结果。Pedro Souza de Oliveira 等人专注于预测与二维大气扩散案例相关的浓度场。即使考虑到风的影响,作者们也取得了有希望的结果。
5.1.3 直接替代模型中的观察趋势
计算时间节省
替代模型提供了几乎即时的预测,取代了耗时的CFD模拟,从而实现了巨大的计算时间节省。作者们通常声称这些模型比传统CFD模拟快几个数量级。然而,必须权衡这一优势与模型的泛化能力,以及数据生成和模型训练(包括超参数优化)所需的时间。
许多模拟必须运行以填充学习数据库,通常从几十次到几千次不等。最佳实践是平衡数据库大小与模型性能。大多数研究采用了RANS求解器来在合理的时间范围内生成数据,从而导致模型的准确度有限。
如果模型是针对特定情况定制的,那么每个新研究都必须重新进行整个学习过程。尽管计算时间的节省可能不那么显著,但当需要多次调用代理模型时,例如进行优化时,这种重新训练策略仍然是有效的。Mortezazadeh 等人证明,使用风向的角度步长为某一特定城市区域的风能潜力预测训练模型的数据库可能是足够的。在他们的案例中,生成数据库需要24小时的计算时间。Zhou和Ooka以及Quang等人详细展示了经典CFD方法与代理模型方法之间的计算时间比较,包括数据生成和模型训练。Glumac等人以及Wei和Ooka指出,减少重新训练成本的一个有前景的方法是使用预训练模型,即迁移学习。
高层次指标与空间场
将学习重点集中在高层次目标上似乎是一种有效的策略。这些模型表现出了良好的准确性,尤其在建筑环境研究的早期阶段,精度要求可能不高时,这一点尤为重要。根据这些研究,弱点如下:(i)泛化能力。大多数研究集中于具有强假设的有限使用案例,例如简单几何形状;(ii)缺乏可解释性和探索可能性。由于模型输出的是高层次指标,因此传统CFD模拟中的许多有价值信息丢失了。在实践中,提取完整的流动特性通常是至关重要的,至少用于一致性检查;(iii)没有不确定性估计。对于工程用途来说,使用黑箱模型而不估计不确定性是不明智的,特别是在外推任务中。
随着机器学习方法的发展,越来越多的研究尝试预测空间场(见表1)。这种方法具有吸引力,因为它解决了缺乏探索可能性的问题。Huang等人展示了获取全球信息(即空间场)在优化城市街区中的重要性(见图12)。实际上,基于生成对抗网络(GAN)的场代理模型在这一优化任务中优于基于全连接神经网络(FCNN)的平均指标代理模型。
从我们的角度来看,空间场代理建模是扩展机器学习在CFD工程研究中应用的关键方法。尽管结果很有前景,但模型的泛化能力仍然是一个显著的担忧。此外,我们注意到大多数研究集中在二维案例或预测二维切片,表明该方法在扩展到三维时存在困难。
 图12.
图12这里展示了Huang等人在他们研究中提出的两种代理模型。进行了比较,比较了生成模型预测感兴趣的场(a)和全连接神经网络预测高层次指标(c)。
全局方法与局部方法
如表1所示,ML-CFD研究可以根据其预测范围分为两种主要方法:全局方法和局部方法。
一方面,全局方法提供对整个研究领域的同时预测。高层次指标替代模型(见5.1.1节)主要依赖于全局方法,因为输出结果对应于总结全球模拟的某些指标。提供全球预测的空间场替代模型(见5.1.2节)要么从特征生成输出,要么保持输入和输出之间的空间排列(见例如图12a)。然而,如果模型输入或输出的维度依赖于领域大小,(i)模型可能是针对特定领域大小定制的,(ii)学习过程不太可能适用于大范围领域。因此,它们可能在泛化和可扩展性方面存在缺陷,以下几个例子可以证明这一点:(i)使用FCNN预测空间场时,采用全局方法无法在不重新训练的情况下泛化到新领域;(ii)在处理问题的维度时,复杂的深度学习架构被应用,例如CNN,FNO和GAN;(iii)Peng等人在3D城市规模仿真工作中遇到了GPU内存限制。
另一方面,局部方法提供对领域子部分的预测(图13)。通过将相同的模型应用于领域的不同子部分,可以生成预测图。因此,这种方法特别适用于空间场的预测。与全局方法类似,局部预测依赖于手工特征或来自局部流场的原始数据作为输入。这种局部处理限制了问题的维度,即输入和输出大小通常是合理的,这带来了几个主要优势:(i)模型架构更简单,(ii)模型预测可以扩展到任何领域大小,(iii)学习过程数据高效,因为一次全局仿真提供了许多局部样本。直观地看,相较于全局方法,潜在的缺点是输入可能不足以解决局部问题,即问题是病态的。此外,如果所有局部预测都独立进行,可能会导致预测场缺乏整体一致性。Pedro Souza de Oliveira等人展示了局部方法可以用于非稳态和稳态污染物扩散预测。在给定单元格的情况下,他们收集了该单元格及其邻域的信息作为输入,利用FCNN预测下一个单元格状态(图13)。Shao等人使用图神经网络(GNN)预测节点级的下一个状态(图11)。通过这种方法,他们的模型可以扩展到任意大规模的城市场景。我们注意到一些研究将位置作为输入,即与局部预测相关的全局坐标进行预测。在我们看来,这种选择可能与创建一个多功能的局部模型不太一致,因为全局位置信息可能导致过拟合。
图13. Pedro Souza de Oliveira等人描述的局部方法
该模型仅使用局部状态作为输入进行局部预测。特别地,这种方法使得无需额外训练即可在任何领域中进行扩展。
瞬态仿真预测 
大多数已审阅的研究以经典方式处理问题,假设流动是稳态的。然而,模拟时间演化可能是重要的。Hodges等人和Lattimer等人进行了不稳定火灾仿真。然而,这些模型预测的是时间平均输出,并未针对瞬态预测进行设计。Shao等人指出,他们的物理信息图神经网络(GNN)在采用大约20倍较大时间步长时,保持了一致的预测。这一优势对于提高不稳定问题的计算效率至关重要。Peng等人和Pedro Souza de Oliveira等人解决了瞬态问题,并展示了对单一时间步长过渡的强大预测能力。然而,作者揭示了与机器学习顺序时间步预测相关的误差累积问题。因此,数据驱动的长期不稳定仿真可能会遇到稳定性问题。
物理嵌入
尽管科学机器学习(SciML)正在迅速发展(见第3.2.2节),但将物理嵌入到建筑环境研究的代理模型中的努力仍然有限。Wei和Ooka以及Shao等人在损失函数中加入了边界条件约束或底层方程残差的项,即物理信息神经网络(PINN)方法。Wei和Ooka发现,PINN方法能够使结果更加符合物理定律,并且在数据有限的情况下具有更强的鲁棒性。Peng等人将FNO应用于现实的城市尺度仿真,并展示了高精度。多篇文章讨论了将物理嵌入的未来工作,强调了研究这一方向的重要性。
5.2 用于建筑环境CFD应用的降阶模型
降阶模型通过捕捉主要流动特征,能够为建筑工程CFD研究提供接近实时的预测(见第4.3节)。Masoumi-Verki等人回顾了降阶模型在预测城市气流和污染物扩散方面的最新进展。他们报告称,目前的研究重点是非线性降阶模型(NIROMs),这类模型在逼近真实世界的非线性风流方面展示了优越的潜力。作者还指出,POD(主成分分析)技术可能不是城市气流的最佳选择,因为边界条件的不断变化可能会降低POD的性能。

表2列出了近年来一些利用降阶模型(ROMs)进行建筑相关应用的研究。机器学习技术被应用于降阶模型开发的两个主要阶段:降维和计算特征动态。

 表2

 经典的POD方法在建筑环境建模中得到了广泛研究,但仍然是降维的标准方法。Lattimer等人在一个简单的二维案例中(见图10)展示了POD如何以比CFD模拟快2-3个数量级的速度,合理地表示全局的浮力羽流。通过将POD与径向基函数(RBF)插值相结合,Luo等人成功地获得了准确且快速的室内气流预测。然而,自编码器(AE)在室内和室外研究中表现出了更好的结果。Masoumi-Verki等人确认,基于神经网络的先进非线性方法对于降维步骤具有良好的前景。在对自编码器进一步研究后,可以明确看到,完全连接的自编码器在处理问题的维度时扩展性较差。卷积自编码器(AE-CNN)更适合复杂的流体动力学问题,例如与城市区域相关的问题。Masoumi-Verki等人通过考虑流动的多尺度特性,改进了AE-CNN方法。作者解释说,卷积层仅捕捉数据之间的局部相关性,在非局部相关性方面可能会受到限制。为克服这一限制,他们实现了多尺度卷积自编码器和自注意力卷积自编码器。研究表明,自注意力AE-CNN模型在重建简化城市几何体的速度场方面优于其他模型。在类似的场景下,Masoumi-Verki等人证明,生成对抗自编码器在预测流场的湍动能方面优于自注意力AE-CNN。因此,当POD在处理复杂气流时效果不佳时,先进的神经网络方法,如生成对抗自编码器或AE-CNN,可以成功地以合理的精度减少维度。
神经网络技术也越来越多地参与到降维空间中 特征动态的计算中。Luo等人强调了RBF插值能力的局限性,并建议使用更好的插值器,如神经网络或支持向量机(SVM)。循环神经网络(例如LSTM)或时间卷积神经网络(CNN)已成功应用于城市外部气流的预测。
表2突出显示了像极端梯度提升(XGBoost)或长短期记忆网络(LSTM)这样的先进机器学习回归技术,已经被应用于建筑环境相关的研究中。
在所审阅的论文中,所提出的降阶模型(ROMs)在计算时间上取得了显著的提升。与传统的CFD仿真相比,这些模型的计算时间缩短了2到6个数量级。然而,与直接替代建模(见第5.1.3节)类似,这些结果需要与模型的泛化能力、数据集创建时间以及模型训练所需的时间相平衡。尽管如此,基于ROM的控制系统仍然引起了广泛的兴趣,尤其是在需要对模型进行大量调用的情况下。
尽管降阶模型(ROMs)非常强大,但需要注意的是,ROM通常是针对特定情况进行调优的。正如Luo等人所指出的,如果几何形状或域内的其他方面发生变化,则需要重新构建ROM。尽管如此,研究表明,ROM可以适应不同的边界条件。即使需要重新构建ROM,迁移学习技术也显示出加速这一过程的潜力。
尽管基于神经网络的非线性降阶模型(NIROMs)具有巨大潜力,但仍需解决一些挑战。主要的弱点包括训练的计算成本、模型的物理解释、物理嵌入以及模型的稳定性和鲁棒性。尤其是物理解释,这对于工程应用来说是一个重大挑战。与黑箱模型不同,经典的降阶模型(如POD-Galerkin)具有显著的物理可解释性(见第4.3节),尽管它们在提高降阶模型精度方面具有潜力。将更多物理知识融入这些数据驱动的模型对于提高其性能和可解释性至关重要。虽然已有努力在解决这些挑战,但仍需继续推进,以便将降阶模型应用于日益复杂和现实的情况。
5.3 混合方法在建筑环境CFD应用中的研究
尽管机器学习模型能够显著减少计算量,但它们的可靠性和准确性仍无法与CFD模拟相提并论。特别是在处理长期模拟时,这一点尤为明显,因为纯粹的机器学习预测会随着时间推移迅速偏离物理现实(见5.1.3节)。此外,正如前文所述,模型的泛化能力通常有限。对于工程应用来说,模拟的可靠性至关重要。虽然在早期设计中为了节省计算时间可以接受牺牲准确性,但量化误差仍然是一个挑战。因此,依赖机器学习模型进行外推任务是具有一定风险的。为了应对这些局限性,Westermann 和 Evins讨论了灰盒方法,这种方法不仅仅依赖于数据。灰盒方法可能提供黑盒机器学习模型和经典基于物理的模拟之间的更好折衷方案。目前的研究正致力于将两种方法进行混合,以弥合纯机器学习方法与纯CFD方法之间的差距。正如4.1节所述,这种混合方法可能带来更为适度的计算收益,但能够保持宝贵的物理一致性。
许多建筑环境研究探讨了混合方法。Quang 等人指出,在他们的未来工作中,探索机器学习模型是否能加速稳态模拟至关重要,特别是在将其用作高精度CFD模拟的预热设置时。通过这种策略,模拟可能会以更快的速度收敛,同时保持较高的准确性。
Saboori 等人开发了一种基于机器学习的方法,用于预测含有相变材料的大孔隙尺度多孔介质Trombe墙的流动行为和热模式。他们使用微尺度的高保真CFD结果来训练递归神经网络。这些模型使他们能够扩展到大范围的预测。因此,他们进行了长期模拟,并优化了Trombe墙的组成,这是传统数值方法无法做到的。我们认为,一个有前景的短期研究方向是通过数据驱动的方法近似那些成本高昂的子组件,然后将其集成到经典的基于物理的仿真中。
Mendil 等人提出了一种新型的混合策略,用于预测城市区域 2D 剖面中的户外污染物扩散(图 14)。该方法将一个简单、快速且可解释的高斯羽流模型与屏蔽和修正块相结合。屏蔽操作强制执行空间约束,而修正阶段则通过在合成数据上训练深度神经网络来减轻不一致性。最终的结果是即刻可得的,具有物理可解释性,并且能够以合理的精度推广到任何简单的城市几何形状。尽管该方法有改进空间(例如 3D 预测、严格的质量守恒、更复杂的条件等),但这篇文章证明了纯粹的数据驱动模型并非提升 CFD 与 ML 相结合的唯一途径。
更一般来说,使用 ML 模型学习物理模型的修正是一种有前景的方法(见第 4.1 节)。在这一方向上,Waibel 等人使用廉价的基于物理的快速流体动力学计算结果作为输入,利用 ML 模型预测高层建筑立面上的风压。他们假设这种耦合方法可以在保持模拟时间较短的同时,提高简化模型的精度。我们同意他们的观点,即基于物理的模型不会很快被取代,并且它们将在将 ML 融入建筑工程中发挥关键作用。在另一种方法中,Wang 等人提出了一个数据驱动框架,用于发现适用于城市气流的稳态 RANS 模拟的非线性雷诺应力修正模型。这一修正可以提高预测精度,并扩展 RANS 方法在更广泛工程场景中的适用性。
Fig. 14. Mendil et al.提出的户外污染物扩散的混合策略示例。深度神经网络参与了修正阶段。预测首先通过高斯羽流模型启动,掩蔽阶段确保了空间约束。
5.4 综合讨论与未来挑战
5.4.1 新兴趋势
综述的文章突出了大量研究探索了机器学习(ML)在加速建筑环境中计算流体力学(CFD)计算的潜力。表3提供了观察到的趋势总结。
到目前为止,主要的研究重点是利用基于机器学习的直接代理建模来替代整个CFD模拟。代理模型通常针对感兴趣的高层次指标,但我们也观察到许多尝试预测空间场的研究。空间场代理可以提供更准确和详细的估计,但通常需要复杂的深度学习架构。尽管直接代理建模可能是最容易实现的方法,但已有文献表明,这些模型面临着可泛化性和可解释性的重大挑战。特别是在涉及外推任务时,模型的准确性可能会下降。然而,必须承认,直接代理模型在约束且定义明确的情境下能够提供足够的准确性,并且能节省大量的计算时间,可能节省几个数量级的时间。
降阶模型已展示出在保持合理准确性的同时,能够提供显著的计算时间节省,特别是对于特定的流动配置。近年来,研究重点已转向非线性和非侵入式降阶模型。先进的机器学习方法越来越多地应用于降维(如卷积自编码器)和特征动态估计(如递归神经网络或极端梯度提升)。
5.4.2 挑战与未来方向
尽管在使用机器学习技术加速建筑环境CFD模拟方面充满了热情,我们也突出了未来研究中需要解决的主要挑战。我们建议未来的努力应与科学机器学习(SciML)社区进行更多互动,以填补以下空白。
参考训练数据。由于所涉及的使用案例性质各异,本文特意避免了直接比较各研究模型的表现。此外,已有文献表明,科学机器学习(SciML)研究中常出现过于乐观的结果,这导致了对实际计算时间节省和最有效方法的混淆。因此,必须发布与建筑工程相关的开源参考数据集。这些数据将促进不同方法的公平比较,并推动新举措的发展。正如McGreivy和Hakim所支持的那样,建立具有明确评估指标和基准的领域特定挑战问题,将有助于引导研究工作集中于有影响力的课题。高保真参考SciML数据集的出现,这些数据集代表了现实世界的现象,凸显了建筑行业必须紧跟这一趋势,并将其自身的挑战推向前沿的重要性。
扩展性和计算成本。大多数研究集中于2D预测,并使用通过RANS模拟生成的学习数据。这凸显了在数据整理和模型训练耗时的过程中,快速开发有效模型的挑战。尽管回顾的研究提供了宝贵的概念验证,但未来的研究必须展示将模型扩展到真实3D问题的能力,并能够从更高保真度的数据中学习。
迁移学习被提议作为减少训练阶段成本的潜在解决方案,但仍需进一步研究。其基本概念是利用预训练模型来解决与原始问题相关的新问题,例如,针对不同领域的相同任务。新模型可能使用较小的数据集进行训练,缩短训练周期,并具备更强的泛化能力。因此,迁移学习可以使专门针对特定配置的快速训练模型的普及成为可能,这些模型可能比复杂的通用模型更容易训练且更准确。
局部方法(在第5.1.3节中描述)集中于领域的子部分,为解决可扩展性、模型复杂性和数据效率问题提供了一个有趣的视角。一些研究集中于细胞级预测,而其他在SciML领域的作者则建议将领域划分为块,这可能是解决大规模问题的更好折中方案。一些稀疏连接的网络架构也可以被视为局部方法。例如,通过全卷积网络或图神经网络(GNN),可以在推理时修改领域的大小。然而,它们在训练和推理时可能特别消耗内存。鉴于建筑研究中大规模领域的普遍存在,我们建议对局部方法进行更严格的检验,因为它们可能有助于开发能够应用于工业案例的模型。
物理学融入与混合化。提高机器学习(ML)模型的数据效率、泛化能力和可解释性是工程应用中亟需解决的问题。此外,还应找到一种方法来控制ML模型在瞬态仿真中的误差积累。从我们的角度来看,将更多物理知识融入训练过程,并推动与数值求解器的更大混合,是这一方向上的关键步骤。像物理信息神经网络(PINNs)、图神经网络(GNNs)、神经算子或混合策略等有前景的方法,已开始被纳入最近的建筑环境研究中。然而,它们在现有文献中的应用仍然不足。这些努力需要继续推进、结合并扩展,以便生产出更可靠的模型。最近的SciML进展(见第4节等)必须传播到建筑环境领域。

6.结论


本综述的主要目标是探讨机器学习算法在加速建筑环境计算流体力学(CFD)计算中的潜力。本文讨论了当前的趋势、前景以及面临的挑战。

我们的综述强调了机器学习方法在加速建筑环境计算流体力学(CFD)中的广泛研究。目前,最为普遍的方法是深度学习直接代理建模和降阶模型,这些方法展现了显著的计算时间缩减。然而,在模型的泛化能力、可扩展性、可解释性和部署前的计算成本等方面仍存在关键的不足,这些问题需要在广泛应用之前得到解决。为克服这些挑战,我们提倡采纳新兴的科学机器学习(SciML)趋势,特别是将物理原理融入训练过程以及实现强健的混合ML-CFD求解器,这些都是值得深入探索的重要方向。值得鼓励的是,已有一些研究朝着这一方向取得了进展,但仍需更大努力。此外,迁移学习和局部方法被认为是加速实际CFD案例的重要手段,推荐进一步研究。最后,我们认为,建筑环境领域的研究者提出挑战性问题并提供开放的CFD数据集至关重要。

尽管本综述重点讨论了机器学习技术,但声称它们是唯一或最优的减少计算时间的方法是不正确的。然而,我们坚信它们将在这一目标的实现中发挥重要作用。目前的文献对深度学习给予了大量关注,但必须承认经典的机器学习方法同样有效,并且认识到并非在所有情况下都应当用深度学习替代传统方法。      

根据本综述,机器学习在建筑环境计算流体力学中的应用正在朝着提供更快速、更准确、可靠且可扩展的模型发展。这一进展将有助于建筑设计的初步阶段和详细阶段,促进新型控制与优化策略的发展,并为全面的建筑设计铺平道路。


本文翻译自:《Building and Environment》“Machine Learning to speed up Computational Fluid Dynamics engineering simulations for built environments: A review”


来源:多相流在线
非线性化学动网格多孔介质湍流通用建筑风能UM参数优化材料创新方法数字孪生人工智能
著作权归作者所有,欢迎分享,未经许可,不得转载
首次发布时间:2025-01-11
最近编辑:1月前
积鼎科技
联系我们13162025768
获赞 160粉丝 124文章 335课程 1
点赞
收藏
作者推荐

同是LevelSet技术,国产CFD软件如何在捕捉气液界面时更精准和高质量守恒?

摘要:本文主要是针对VirtualFlow软件中的LevelSet方法进行介绍,侧重于软件中LevelSet方法的特色及设置参数的背后原理,通过实验对比说明该模型的仿真精度,最后对该模型的应用场景案例进行介绍。1、VirtualFlow界面流模型VF中有两种处理界面流的方法,分别是VOF方法和LevelSet方法,两种方法各有千秋,相关的不同与优劣,在文章《LMFD应用|LBM直接求解水平集方程,实现气液/液液两相流模拟》中有详细的介绍,有感兴趣的读者可参考阅读。VirtualFlow中的VOF模型与其他CFD仿真软件是一样的,但是在LevelSet模型上独到之处。与其他商业软件相比,VirtualFlow的LevelSet模型不但可以精确捕捉气液界面,而且可以尽可能的做到了质量守恒。下面对VirtualFlow中LevelSet模型原理和设置进行较为全面的介绍。其LevelSet模型设置的界面如下图所示:界面宽度系数:最小单元格大小与界面宽度之间的比率,该系数的大小确定了界面的清晰度。不同的界面宽度系数对交界面清晰度的影响如下图展示,可以很直观的发现,在网格尺寸一定的情况下,该值越小,界面厚度越薄,界面越清晰。但是太小会导致计算的不稳定,一般保持默认值1即可。在VirtualFlow中的LevelSet模型有众多调节参数,其中界面宽度系数对界面清晰度的影响尤其重要。H函数:用于定义光滑界面区域气体和液体比例的函数类型。在VirtualFlow中提供了三种H函数,分别是Tanh、Linear和Sharp,通常采用默认设置即可。Delta函数:用于计算界面处Diracdelta函数的方法,它表示为H函数的梯度,通常采用默认设置即可。LsNarrowband:此选项对LevelSet函数更新范围相关,如果选定该选项,则LevelSet仅在界面周围的区域进行更新。表面张力模型:水等液体会产生使表面尽可能缩小的力,这个力称为“表面张力”,对于表面张力的计算,是在通量方程中添加源相的方式处理的:采用ContinuumSurfaceForce(CSF)方法来对表面张力源项Fσ建模:面法向:界面曲率:其中σ为表面张力系数,δs为DiracDeltaFunction(界面处为1,其他为0),χ是在LevelSet方法中连续水平集函数ϕ。对于表面张力占主导地位的流动,通常是小尺度的流动,但是如果表面张力源采用显式处理,会导致时间步长的限制过于严苛,最终导致仿真需要用很小的CFL条件和很小的时间步长。表面张力的隐式处理可以解决这个问题,再计算过程中可以使用更大的CFL数和较长的时间步长。在VirtualFlow中可以通过选中相应的框来打开,如下图所示。这种方法允许将表面张力时间步长标准(参见部分控制参数)设置为高,VirtualFlow参考手册中建议的表面张力最小=5.0最大=10.0。动态接触角模型:VirtualFlow有静态和动态接触角仿真的能力。润湿动力学的处理基于与三相线相关的物理力。动量方程中包含了额外的三线接触力ci,三线力(ci)基于界面自由能的考虑。因此,它只包含两个参数:流体之间的界面张力γ和平衡接触角θeq。其中θdy是瞬时动态接触角,δt是一个光滑的狄拉克δ函数,除了靠近三重线之外,其他地方值为0,其性质是对于任何体积V,∫_VδtdV等于V中包含的三重线段的长度,b是垂直于三重线并平行于壁面的单位向量。此外,假设剪切应力在接近接触线时具有对数分布。在距离三重线小于滑移长度的地方,则假设完全滑移。在包含三重线的有限体积中,会使用积分剪切应力。滑移长度通常被处理成一个极小值≈10-9。这个公式解决了由于无滑移边界条件而产生的应力奇异性。在VirtualFlow中,接触角可以在软件设置窗口中设置,如图所示。如果停用动态接触角模型,则平衡接触角的值将用作静态接触角,要为每个壁边界指定不同的值,在壁面边界条件中设置即可。在VirtualFlow中可以指定的最大接触角为170°,最小为10°。液膜厚度模型:对于非常接近完全润湿或完全非润湿的情况,还可以使用薄膜边界条件。像毛细管数非常低的流动,气相和壁面之间存在一层薄薄的水膜。可以定义薄膜条件,在VirtualFlow中进行仿真。根据Couette流动,设置薄膜边界壁处的粘度以满足剪切。对于液膜条件,我们通过下图进行理论解释:薄膜边界条件示意图其中与壁面相切的界面速度:有效粘度根据下式得到:通过简化可得:接触角和液膜厚度,在壁面边界条件中进行设置,界面如图所示:界面涡粘度衰减:当使用k-ε模型时,界面区域的湍流粘度可以被阻尼。事实上,该区域的湍流粘度通常被高估,从而导致表面运动的阻尼。在VirtualFlow中提供了None、AKN、Wallfunc、Cubic等四种方式控制抑制界面处的湍流粘度。表面张力系数:表面张力系数σ是指在温度T和压强p保持不变的情况下,吉布斯自由能G对液体表面积S的偏导数。它反映了液体表面层分子间的相互作用力,这种力使得液体表面趋向于收缩到最小面积,即球形。表面张力系数的物理意义在于它量化了液体表面层分子间相互吸引的强弱程度,它对微流和气泡或液滴仿真有至关重要的作用。马兰戈尼效应:马兰戈尼效应发生在两种液体接触时,如果这两种液体的表面张力不同,它们之间的界面就会存在表面张力的梯度。这种梯度会导致表面张力大的液体对周围表面张力小的液体产生拉力,从而引起质量的移动和液体的流动。VirtualFlow通过对表面张力系数的模型化修订实现马兰戈尼效应的仿真,该模型中,表面张力系数依赖于温度的函数:其中,σ0是温度T0时的表面张力系数,Tcrit是表面张力为0时的材料温度。而马兰戈尼效应对Navier-Stokes方程的贡献是表面张力的温度依赖性产生的剪切应力界面的切向投影,可以表示为:Redistancing:在LevelSet方法中,要用由于数值误差导致水平集场的轮廓随着相位的移动而变形,因此需要一种Redistancing算法来正则化该函数:平流初始距离函数φ(x,0)将不会保持不变。需要一种额外的Redistancing算法,在φ的零级附近保持|∇φ|=1。VirtualFlow采用的是Sussman在1994年提出的方法,理论公式如下:其中sgn(φ)=2H(x)–1,d0(x,t)=φ(x,t),并且在重新初始化过程中,增加上述表达式中的最后一项以保持气泡体积恒定。该方程被迭代直到|∇d|=1。然后通过设置ϕ(x,t)=d(x,ε)来获得校正后的ϕ场,其中ε是达到收敛的时间。在VirtualFlow中,提供了三种处理在初始化的格式,分别是WENO、FastMarching1storder、FastMarching2ndorder,通常情况下选择三阶WENO格式处理再初始化过程,保证精度和稳定性,RedistancingSteps属于内循环最大迭代步数,通常保持默认即可,设置界面如下图所示:相关理论和实现方式可参考:https://www.researchgate.net/publication/2642502_An_Efficient_Interface_Preserving_Level_Set_ReDistancing_Algorithm_And_Its_Application_To_Interfacial_Incompressible_Fluid_Flow2、实验验证气泡形态验证分别用VirtualFlow与商软对气泡形态变化过程进行仿真。从图(a)是实验值与VirtualFlow的LevelSet模型仿真对比,红色半圆是实验中气泡形态,绿色半圆是仿真的气泡形态。可见仿真和实验吻合的非常好;图(b)是用商软的VOF模型进行的仿真,可以看到仿真的气泡形态与实验吻合的不好;图(d)是用不同的模型模拟图(c)过程中气泡变化过程,可以看出用VirtualFlow的LevelSet模型仿真的结果是与实验值完全吻合的(绿色)。液面晃动验证从水箱摇晃的液面变化的实验对比可见,仿真没有出现实验中的液体碰壁溅落现象,这主要是因为网格精度较粗,并且采用二维仿真导致。除此之外,液面的运动形态与实验非常吻合。3、应用场景展示车库入水仿真:特大暴雨可能引发地下车库入水,采用LevetSet方法可精准分析入水过程状态变化。可以模拟特大暴雨条件下地下车库的进水过程,预测洪水可能达到的高度、速度和影响范围。根据仿真结果,可以评估现有排水系统的效能,并优化排水口的位置、大小和数量,以确保在暴雨条件下能够迅速排出积水。还可以为地下车库的逃生通道和避难点设计提供参考,确保在洪水发生时人员能够迅速撤离。段塞流捕捉器:段塞流会引起管道完整性问题和分离器的不稳定性问题,采用LevelSet方法可以精确地捕捉管内流动界面特性。通过仿真模拟不同结构参数的段塞流捕捉器内部的气液流动情况,找出最优的结构设计,评估段塞流捕捉器在不同工况下的性能,包括处理量、分离效率、压力损失等,为实际应用提供理论依据。溢洪道:LevelSet方法可分析泄洪消能过程中的水流状态变化,由于算例几何为单孔模型,没有闸墩结构影响,所以水流相对平顺,且没有折冲现象。从仿真与实验对比可见,通过VirtualFlow数值模拟结果与物理模型试验值非常吻合。油箱晃动:CFD仿真能够模拟油箱内燃油在不同工况下的复杂动态行为,包括燃油的晃荡、涡旋的形成与消散等,为油箱的设计提供直观且精确的数据支持。利用VirtualFlow的LevelSet模型可以分析油箱结构对燃油晃动的影响,进而对油箱结构进行优化,如调整油箱的长宽比、深度、隔板设置等,以降低燃油晃动对飞机或汽车稳定性的影响。

未登录
还没有评论
课程
培训
服务
行家
VIP会员 学习计划 福利任务
下载APP
联系我们
帮助与反馈