国产工业软件能否跟上?国际巨头们都在押宝ROMs和代理模型!
随着基于人工智能的仿真技术逐渐兴起,降阶模型(Reduced Order Models,简称 ROMs)或称为代理模型(Surrogate Models),正受到越来越多的关注。在工程工作流程中,它们能够大幅缩短仿真时间,这一优势极具吸引力。从广义上讲,任何简化的仿真模型都可以被视为降阶模型或代理模型。这一术语通常用于描述从机器学习和人工智能训练中得到的简化模型,但它们也包括其他方法,例如减少网格数量(将高分辨率模型转换为低分辨率模型以节省计算时间)、将三维问题简化为二维(专注于模型的横截面而非整个模型),甚至包括简单的估算方法。SmartUQ 公司的首席应用工程师 Gavin Jones 指出:“例如,简化一个非常复杂的计算流体动力学(CFD)模型中的物理过程,就可以得到一个降阶模型。数据驱动的方法同样可以得到降阶模型。当使用数据驱动方法时,得到的降阶模型通常被称为代理模型。因此,所有的代理模型都是降阶模型,但并非所有降阶模型都是代理模型。”开发数据驱动的降阶模型或代理模型是 SmartUQ 的专长。“仿真通常需要求解大量的微分方程组,这需要大量的计算时间。然而,一旦代理模型经过训练,就可以在无需求解这些方程组的情况下快速进行预测。” Jones 进一步解释道。“如今,降阶模型构建工具已经被集成到软件中,这无疑使操作变得更加容易。” Veryst Engineering 公司的首席工程师 Matthew Hancock 表示,“像 COMSOL Multiphysics 等仿真软件以及其他大型仿真软件包中都包含了这类工具。几乎所有大型软件公司都在尝试开发此类工具(如 COMSOL、Ansys、Siemens、Cadence 等),因为这是市场的需求。”图:GE(通用电气)正在使用代理模型来加速设计和模拟过程他的同事、Veryst Engineering 的首席工程师 Sean Teller 指出:“如今,用于开发降阶模型的神经网络库更加容易获取。人们现在更多地讨论代理模型。这些模型也是我们自身工具库的一部分,但我们的使用量并没有显著增加。”假设你有一系列存档的仿真运行结果,显示了具有不同弯曲角度的相同阀门设计会产生不同的水压。数据驱动的方法使你能够识别弯曲角度与输出压力之间的相关性,从而在后续设计中无需进行完整的仿真运行。“数据基于物理原理。因此,首先需要一系列基于物理的仿真来训练模型。” Ansys 公司的高级 CFD 工程师 Yann Ravel 说道。2024 年 1 月,Ansys 推出了 Ansys SimAI,这是一个支持云服务的生成式人工智能平台。Ansys 表示:“Ansys SimAI 使用设计本身的形状作为输入,即使训练数据中的形状结构不一致,也能促进更广泛的设计探索。该应用程序可以将计算密集型项目在所有设计阶段的模型性能预测速度提高 10 到 100 倍。”图:基于机器学习的非定常流动降阶建模:针对不同形状钝体的研究SimAI 是基于 GPU 加速的。要在 SimAI 中开发降阶模型,你需要上传仿真运行的边界条件,以及带有物理场的表面或体积。Ravel 澄清说,边界条件并非强制要求。它使用开源的VisionTools Pro 格式作为输入。大多数仿真程序专注于特定类型的物理过程:结构力学、电磁学、流体动力学等。在运行仿真时,软件会利用这些物理过程的已知原理来计算位移、变形、压力积聚、气流等结果。然而,数据驱动的方法则截然不同。“[人工智能AI] 并不试图理解所涉及的物理过程。” Jones 说,“它只是试图查看输入和输出之间的相关性。” 责任在于用户——即人类领域专家——他们需要认识到训练数据集的局限性以及代理模型预测中的异常情况。例如,看到在现实中不可能出现负值的地方出现负值,或者意识到设计中使用的新制造材料并未包含在训练数据集中。这些迹象表明需要重新评估代理模型的可靠性。“除了用于开发代理模型的工具外,SmartUQ 还提供了可以量化模型不确定性的工具。” Jones 指出。SmartUQ 可在 Windows 和 Linux 系统上运行,据 Jones 介绍,该公司计划在 12 月发布的新版本中增加 GPU 加速功能。“人工智能的优势在于它可以处理多个参数。” Ravel 说,“人类工程师必须一次只改变一个参数来确定该变化的影响,但你可以向人工智能输入大量输入数据,它能够找出其中的相关性。”对于初入人工智能仿真领域的人来说,经常会面临一个关于数据量的问题:需要多少次仿真才能开发出可靠的降阶模型?专家们通常不愿给出一个具体的数字,因为需要考虑的变量太多。图:Ansys 模型评估报告显示了在 SUV 数据上训练的 SimAI 模型的有效性一个问题是仿真运行本身的成本。例如,设置和仿真汽车碰撞所需的时间和精力远多于仿真手机掉落。因此,针对人工智能训练所执行的仿真数量将因用户而异,取决于目标应用。“仿真设置所需的时间以及仿真运行所需的时间会影响一个人愿意收集多少训练数据。” Jones 解释道,“如果有人因为收集数据过于耗时而减少数据收集量,那么权衡的结果将是代理模型的准确性降低。”Teller 指出,要同时进行多次仿真以收集数据,“你需要额外的软件许可以及硬件,这会显著增加同时仿真的成本。”Hancock 补充道:“你需要跳出当前数据集的局限进行思考。如果你打算使用 10,000 次仿真,那就使用那些彼此不同的、边界条件不相似的仿真,以扩展你的设计空间。”对于 Ravel 来说,数据量少并不一定是个问题;更重要的是数据的一致性。“如果你只有 20 次仿真运行,那就从这些数据开始训练。你知道这不会是最好的结果,但这是一个学习过程。你还可以利用人工智能衍生的模型来查看是否需要更多特定类型的数据以提高其准确性。” 然而,如果你担心数据量有限,Ravel 表示:“SimAI 有工具可以帮助你自动填充数据字段。”对于从头开始的人来说,还有另一个需要考虑的因素。“当你改变输入时,如果你发现输出也呈线性变化,那么人工智能学习相关性所需的仿真次数就会少得多。因此,你不需要太多次仿真来训练人工智能。另一方面,如果关系不是线性的,你将需要更多的仿真。但你只有在开始运行仿真后才会知道这一点。” Jones 说。如果被问及,Jones 表示他会给出简单的指导建议。“我们说一个合理的起点是每个输入维度 10 个样本。所以如果你有六个变量,那么我会建议从 60 次仿真运行开始。但在提出这个建议之前,我需要更好地了解你的仿真问题,以及收集数据对你来说是困难还是容易。”“你的源仿真可能包含温度、速度、压力等,但如果你不需要的话,不要将所有数据都加载到训练模型中。” Ravel 说,“如果你只对产生压力的力感兴趣,那么就针对它们进行仿真。你可能会开发一个用于预测速度的降阶模型,一个用于预测压力的降阶模型,但你不需要一个能预测一切的模型。”实际上,对于许多简单的线性问题,你可能根本不需要费心去训练和开发代理模型。行业资深人士或领域专家可能会给你一个简单的估算公式,其效果同样出色。“如果你在管道中的流量不足,将内径加倍。” Hancock 说,“这将使流动阻力减少十六倍。如果你有一个宽通道,将通道高度加倍可以将流动阻力减少八倍。我们是该领域的专家;这是流体力学的基本知识,所以我们知道这些事情。不同领域的专家可能不知道这些,但我认为合作会更好。将开发良好的代理建模工具与领域专业知识相结合,会让你走得更远。”降阶模型应该不断进化,以纳入新发现,并跟上它们所基于的有限元分析和计算流体动力学物理的发展。“有时,有限元或计算流体动力学软件本身可能会改进,因为物理过程得到了更好的理解。然后你可能想要重新训练你的人工智能模型。” Jones 指出。Ravel 在 F1 汽车运动领域拥有 16 年的计算流体动力学经验,曾与法拉利和雷诺等品牌合作。作为 Ansys 客户卓越团队的一员,Ravel 还使用 SimAI 开发概念验证以与客户分享。“如果你的数据库中有 30 次仿真运行,SimAI 会随机选择其中的三次,将其保留 10%,仅使用 27 次进行训练。” Ravel 解释道,“之后,它会使用这三次不在训练数据中的仿真来挑战或检查人工智能的准确性。”由于这三次被保留的仿真并未参与训练,因此它们无法影响代理模型预测的行为。Ravel 会利用代理模型来查看它是否能够产生与之前保留的三次仿真相同的结果。如果可以,那么就有充分的理由相信该代理模型是可靠的。“基于物理的仿真模仿了现实中的情况。” Ravel 说,“代理模型的准确性不会超过用于训练它的基于物理的仿真。我们可能会因为有了代理模型而减少基于物理的仿真,但它不会取代基于物理的仿真。”图:3D代理模型
“无论是代理模型、降阶模型还是完整的物理模型,它们都包含了一组假设。” Hancock 说,“因此,从某种意义上说,所有模型都是错误的,但有些模型非常有用。你应该始终用现实的东西来验证模型。确保模型能够准确预测产品的实际表现。”如果代理模型或降阶模型的使用变得广泛,那么人类领域专家的角色将变得更加重要,而不是更不重要。“确保你理解模型背后的物理原理。” Hancock 说。
注:部分材料源自网络,仅作为文章分享,版权归原作者所有,如涉侵权,请联系处理,感谢!(转自CFD饭圈)