新论文 | 基于深度学习的滞回模型如何拥有“误差自纠偏”能力？(附数据集和程序)

1年前浏览1550

论文：Xu YJ, Fei YF, Huang YL, Tian Y, Lu XZ*, Advanced corrective training strategy for surrogating complex hysteretic behavior, Structures, 2022, 41: 1792-1803, DOI: 10.1016/j.istruc.2022.05.097

太长不看版

本研究提出了一种使深度神经网络模型拥有“自纠偏能力”的两阶段训练方法，可以有效纠正模型推演过程中的误差累积。通过在不同案例（复杂支撑模型案例与经典BoucWen滞回模型案例）、不同网络上开展分析，证明了本方法的有效性。最后，提出了“数据-物理耦合驱动”的结构响应分析方法，用神经网络代替有限元程序中的部分单元，并在OpenSEES中开展了程序实现。

数据、模型与程序开源

（1）本研究的基础数据集（以及课题组整理的其他一些相关数据、相应的说明文档）可以从下面的链接处下载。使用该数据集进行模型训练的示例性代码也附在同一链接中

https://pan.baidu.com/s/1d8CkF8RCtn4wkqHuiFKLzA 提取码：se54

（2）OpenSEES程序实现的代码和示例可以从下面的链接下载

https://pan.baidu.com/s/1eeO_p0vefwK4j4lPP8CTeQ 提取码：6onk

（3）本数据集是由博士生徐永嘉、费一凡和顾燚等通过自主模拟、收集网络资料等形成的。使用数据、模型与代码时，可以引用：

Xu YJ, Fei YF, Huang YL, Tian Y, Lu XZ*, Advanced corrective training strategy for surrogating complex hysteretic behavior, Structures, 2022, 41: 1792-1803, DOI: 10.1016/j.istruc.2022.05.097

研究背景

基于深度神经网络构建结构响应分析的代理模型，近年来得到很多研究者的关注。此类方法具有拟合能力强、端到端（无需人为干预中间过程）、可以取得“精度-效率”的良好平衡等优点，但也面临诸多问题。在很多案例中，网络的训练过程是并行性的（完整输入序列到完整输出序列的整体映射、Loss计算与反向传播），但推演却是逐步进行的。这一训练和推演的差异，可能导致神经网络的推演过程出现严重的“误差累积”问题，进而导致预测结果偏离真实值。在与有限元等时域逐步积分方法结合时，上述问题可能更加突出。因此，需要提出一种启发神经网络的训练方法，使网络具有一定的误差自纠偏能力，从而有效的纠正误差累积，获取准确的预测结果。

误差自纠偏的两阶段训练方法

传统结构分析方法中，通过反复迭代、收敛检查等手段，对误差进行纠正。但神经网络的训练过程的输入是无误差的真实值，推演过程也不包含上述环节，因此无法有效纠正误差累积（如图1所示）。同时，结构行为预测等属于复杂的高维时间序列回归问题，物理意义明确、输入输出映射关系唯一，既有的Mean-Teacher、大规模预训练等方法并不能很好的解决上述误差累积问题。

图1 误差累积情形示意图

本研究提出的两阶段自纠偏训练方法，核心是“给定有偏输入，启发网络认识误差并纠偏”。其基本思想可以概述如图2所示，详细过程可以描述如图3所示。具体而言：

1）End to End Stage（简称Stage-E）

采用经典有监督训练模式，开展从完整输入序列到完整输出序列的正向传播、Loss计算、反向传播和参数更新；其每一步的预测都是基于无偏差的真实输入、输出开展的。

2）Step by Step Stage（简称Stage-S）

逐步训练，纠正误差。完成Stage-E训练后，从某一初始时间步M开始，开展模型训练K步；其中，第X步训练（M<X≤M+K）时，第1至第M-1时间步的输出是真实值，而第M至第X-1时间步的输出均为存在误差的预测值；输入序列始终为真实值。

图2 两阶段误差自纠偏方法基本思路

图3 两阶段误差自纠偏方法具体流程

绝对-相对误差耦合的推演策略

一个长时间序列包括不同特征的区段，例如“峰”、“谷”等，如图4所示。而神经网络训练同样可以采用多种不同的Loss函数。其中，最常见的Loss函数之一是均方误差MSE，计算公式如图5所示。可以看出，MSE依据每一时间步偏差的“绝对值”计算得到。但对于序列中某些“谷”值区段而言，即使绝对误差不大，相对误差也可能很大。因此，若要更好的控制这些谷值区段的误差，宜采用基于相对误差的Loss函数MRSE（如图5所示）。

基于上述分析，本研究提出了“绝对-相对耦合”的推演策略。在峰值区段（绝对值大于某一阈值）上，基于MSE训练模型并开展推演；谷值区段（绝对值小于另一阈值）上，基于MRSE训练模型并开展推演；中间区段则对两者的推演结果进行插值。论文正文中对阈值等进行了详细讨论，在此不予赘述。

图4 时间序列不同特征示意图

图5 两种Loss计算函数

方法验证

4.1 案例分析

本研究首先基于Huang提出的复杂支撑模型（如图6所示），构建了包含400个样本的数据集，并进行了标准化和随机划分（训练、验证和测试集分别包含320、40和40个数据样本）。随后，采用Zhang et al.构建的BoucWen数据集，作为典型滞回模型的代表性案例。详细数据集说明见正文开头处的链接和论文正文相应章节。

图6 复杂支撑模型

基于Transformer网络的训练和测试结果表明，仅采用Stage-E不能有效纠正误差累积，预测结果可能显著偏离实际。而仅采用Stage-S时，模型准确性接近或稍低于采用本研究两阶段训练方法的情况，但训练稳定性相对较低，获取最佳模型所需训练轮次更多。采用本研究提出的两阶段自纠偏训练策略，可以取得更好的综合表现。图7给出了两个典型案例，图8给出了Huang案例中两种训练策略的训练过程对比，图9给出了BoucWen案例上的交叉验证结果。

图7 典型案例（经典训练：仅有Stage-E）

图8 Huang案例不同训练策略训练过程对比

（策略2：仅Stage-S；策略3：本研究两阶段训练）

图9 BoucWen案例中5折交叉验证结果

同时，基于上述两个案例，本研究还开展了绝对-相对耦合推演方法的效果验证，发现该方法有利于进一步控制模型误差。较仅基于MSE训练模型并开展推演而言，耦合推演结果MSE最高下降27.1%，且相对误差中等（10%-30%）和较大（大于30%）的时间步占比均有显著下降（分别下降44.4%和64.7%）。

4.2 基于复杂网络的补充验证

Wang et al.提出了GRU+Attention机制的UA-Seq2Seq网络。本课题组参考该网络，提出了权重金字塔网络Pyramid-GA（审稿中，参见：http://arxiv.org/abs/2206.03990）。改造后的网络，性能优于经典Transformer，同时复杂度也更高。但基于上述数据集的案例分析表明，仅采用更复杂的网络（Pyramid-GA）难以有效解决误差累积问题，如图10所示。而采用本文的两阶段训练方法后，该问题得到有效解决。

图10 基于Pyramid-GA网络的补充验证

（经典训练：指仅Stage-E）

数据-物理耦合驱动的结构响应模拟

神经网络适合构建复杂行为的代理模型。对于简单的物理模型而言，构建代理模型带来的收益可能有限；而既有研究也提出了许多结构/构件/材料的物理模型。在实践中，一种合理的思路是结合数据驱动和物理驱动策略，提出数据-物理耦合驱动的结构模拟方法。其基本原则是：

（1）基于物理模型，模拟规律清晰、特征明确的组分的响应；

（2）基于深度神经网络，构建特征多样、规律复杂组分的响应代理模型。

本研究提出的两阶段训练方法，在神经网络的推演过程中，隐式的加入了误差纠偏过程，为其与有限元等时域逐步积分法的结合提供了重要支持。基于开源结构分析软件OpenSEES，本研究开展了上述思路的程序实现，方法框架如图11所示，技术路线如图12所示。该方法框架中，前三步为正常的模型训练（采用本研究提出的两阶段训练方法），第四步则是本节即将介绍的模型集成和耦合模拟。

图11 方法框架

图12 OpenSEES程序实现的技术路线

基于图12介绍的方法，将训练好的神经网络模型嵌入后，即可基于该模型，自定义与其响应行为一致的单元，包括twoNodeLink（有一定长度的弹簧单元，需定义单轴“位移-反力”材料属性）和自定义的uniaxialMaterial（新的单轴材料本构等）。若有多个维度，可以通过串/并联多个上述单元实现。相应的源代码和程序见本文起始部分的链接。

随后，基于包含Huang支撑模型的结构模型，开展了方法验证和案例分析。其中结构案例包含单层和双层支撑框架两种，单层支撑框架模型如图13所示，双层支撑框架模型的第二层和第一层一致。

图13 结构模型示意图

案例分析结果表明，两者的模拟精度较为一致，同时数据-物理耦合驱动模拟的耗时仅为5min（Linear-factorOnce算法）或2h（NewtonLineSearch算法）；而LS-DYNA（精细有限元模型）耗时达到180h，为前者的90-2000倍。典型模拟结果如图14所示。

图14 典型耦合模拟案例

总结

本研究分析了经典模拟方法与神经网络训练的异同点，提出了具有误差自纠偏能力的两阶段训练方法，以及耦合MSE和MRSE的推演策略。案例分析表明，上述方法可以有效地控制整体误差、纠正误差累积。最后，本研究提出了“数据-物理耦合驱动”的结构模拟方案与技术路线，并基于OpenSEES开展了案例分析与程序实现。与精细有限元模型的对比表明，数据-物理耦合驱动的模拟方法可以在保持精度基本一致的情况下，显著提升模拟效率。

---End--

相关研究

相关文章，在仿真秀官网搜索：

特刊征稿

Earthquake Engineering Structural Dynamics特刊征稿《地震工程中的AI与数据驱动方法》

专著

英文版《工程地震灾变模拟：从高层建筑到城市区域(第2版)》出版
专著《城市抗震弹塑性分析》出版

人工智能与机器学习

报告视频：《结构生成式智能设计》
用“图”和“图”来生成“图”？中文快不够用了 | 发明专利：多模态输入深度神经网络、框架结构梁柱设计方法及装置
AI想做结构设计？它得先学结构力学！| 新论文及发明专利：物理增强的剪力墙结构智能化设计方法
AI+PKPM | 给个建筑户型图，结构设计全自动
糟糕！结构高度从50m改为100m了。AI：5秒完成新结构方案 | 发明专利：融合文本和图像数据的建筑结构AI设计方法
揭秘人工智能设计剪力墙结构的科学原理 | 新论文：基于生成对抗网络的剪力墙结构设计方法
用人工智能进行结构方案设计| 发明专利：基于对抗生成网络的剪力墙结构布置方法
5分钟！从设计结构方案到完成计算书 | 人工智能设计剪力墙结构案例演示
新发明专利：一种将规范文本自动转为可计算逻辑规则的方法及系统
新论文 | 倾斜摄影点云+深度学习=城市风环境自动化模拟
新论文 | 卷积神经网络 + 小波时频图：基于地震动时频域特征的震害评估新方法
他山之石可以攻玉 | 新论文：基于深度迁移学习的结构地震响应识别
新论文：为提升AI振动识别效果，小波、HHT、MFCC、CNN、LSTM我们都试一试
如何将地震破坏力评估加速1500倍？| 新论文：基于LSTM的地震破坏力实时评估
新论文：基于机器学习方法的多元地震动强度指标比选与实时震害预测
新论文：给振动信号拍个照，可以提升振动控制效果！
这栋楼是什么结构的，元芳，你怎么看？——大人，时代变了！|新论文：使用机器学习方法预测城市建筑结构类型
新论文：基于无人机与深度学习的建筑震害评估方法
新论文：无人机+机器学习+城市弹塑性分析=震后近实时损失预测

城市灾害模拟与韧性城市

视频：城市抗震弹塑性分析及其在情景构建与地震应急中的应用
新论文 | 强震台网密度对震害评估的影响
新论文：城市尺度树木风灾破坏近实时评估：方法框架及清华园案例应用
新论文：基于实测地震动的近实时地震滑坡预测方法(并附源程序)
新论文：基于实测地震记录的区域地震动场模拟方法
新论文：“场地－城市”效应对区域震害评估的定量影响分析
新论文：基于城市信息模型、并同时适用于城市建筑群和单体重要建筑的多灾害模拟框架
新论文：台风风灾对港口运营的经济影响：以中国港口为例
新论文：基于BIM与虚拟现实的建筑震后火灾救援场景模拟
新论文：社区地震安全韧性评估系统及社区应用示范
新论文：武汉火神山医院病房有害气体的高空排放设计和分析
新论文：主余震作用下区域建筑震害预测方法
新论文：城市抗震弹塑性分析的开源框架
新论文：考虑劳动力资源约束的城市尺度建筑抗震韧性模拟和震后维修规划
新论文：结合BIM和FEMA P-58的建筑地震损失预测方法
新论文：扔砖头、跳盒子，这也是做科学试验哦！| 地震次生坠物情境中的人员疏散模拟
综述：城市抗震弹塑性分析及其工程应用
新论文：适用于多LOD BIM的建筑地震损失评估
新论文：城市建筑群多LOD震害模拟及北京CBD算例
美国NSF SimCenter+清华城市弹塑性分析=旧金山184万建筑地震模拟
新论文：BIM+新一代性能化设计=喷淋系统破坏后的地震次生火灾模拟
新论文：村镇建筑群火灾蔓延模拟与案例
新论文：建设地震韧性城市所面临的挑战
新论文：烈焰焚城 | 地震次生火灾的精细化和高真实感模拟
新论文：城市韧性——基于“三度空间下系统的系统”的思考
新论文：城市抗震弹塑性分析中如何确定高层建筑的损伤程度？

高性能结构与防倒塌

新阻尼模型论文 | 频域分布任性变，开源程序免费领
新论文：中柱节点向上和向下冲剪破坏引起的板柱子结构连续倒塌研究
新论文：有限元携手物理引擎，倒塌模拟新思路
新论文：美国佛罗里达公寓大楼倒塌的初步分析和讨论
综述论文：建筑结构抗震“体系能力设计法”综述
新论文：不同钢筋构造对RC板柱节点冲剪破坏后性能的加强作用
新论文：地震－连续倒塌综合韧性防御超高层体系
新论文：基于数字孪生的强震下大跨斜拉桥倒塌易损性评估
新论文丨不同冲剪方向下板柱节点抗倒塌性能研究
新论文：大跨斜拉桥的非线性模型更新及倒塌预测
新论文：新一代地震-连续倒塌综合防御组合框架——综合韧性防御组合框架
新论文：中柱失效后混凝土板柱结构承载性能影响因素研究
新论文：不同冲剪方向下板柱节点抗倒塌性能研究
新论文：次边缘柱失效后钢筋混凝土平面框架连续倒塌承载力的试验分析和计算评估
新论文：基于集群计算的大跨斜拉桥精细有限元模型更新
新论文：钢筋混凝土板柱节点冲切及冲切破坏后行为的数值模拟
新论文：边柱以及边中柱失效后平板结构连续倒塌行为试验研究
新论文：抗震&防连续倒塌：一种新型构造措施
新论文：混凝土梁柱子结构连续倒塌动力效应的试验研究
层间位移角判别准则不适用于剪力墙，怎么办？|新论文：基于曲率的剪力墙损伤评估方法
新论文：地震-连续倒塌综合防御组合框架结构体系研究
新论文：改变框架-核心筒结构剪力调整策略对其抗震性能影响的研究
新论文：新型地震和连续倒塌综合防御韧性PC框架承载力计算方法
新论文：角柱失效后平板结构连续倒塌行为实验研究
新论文：受折纸启发的可更换承载-耗能双功能耗能器
新综述论文：21世纪建筑结构连续倒塌和鲁棒性的研究和实践
新论文：中柱失效后板柱结构连续倒塌传力机理研究
新论文：一根钢筋混凝土梁，承载力你能算对么？| 梁的压拱效应计算方法
新论文：这个混凝土框架能抗震，能防连续倒塌，还功能可恢复，您不进来看看么？
新论文：一个好汉三个帮|带端部阻尼器伸臂桁架的抗震性能试验研究
新论文：防屈曲支撑伸臂桁架？几个“狗骨头”可少不了！
新论文：考虑楼板影响的钢筋混凝土框架边柱连续倒塌试验
新论文：提高地震荷载分项系数，抗震安全性提高了多少？
新论文：采用减振子结构来控制超高层建筑的地震楼面加速度
新论文：500m级超高层建筑简化模型及其在结构体系对比中的应用
606m 超高层建筑OpenSees模型

来源：陆新征课题组

LS-DYNA 振动非线性建筑 BIM 材料数字孪生控制试验人工智能无人机

著作权归作者所有，欢迎分享，未经许可，不得转载

首次发布时间：2023-03-18