摘要
航空发动机运行过程中,可靠性评估是航空发动机可靠性评估领域的关键问题之一,而合理的评估方法能够提高可靠性分析的效率和精度,因此本文提出一种支持评估飞机任务过程中航空发动机运行可靠性的方法。结合飞行任务特点和航空发动机工作特性,以快速存取记录器信息为分析数据,考虑当前运行环境、飞机瞬时状态、发动机当前工作状态3类因素对运行可靠性进行分析;将随机森林算法与分层抽样法结合对数据进行拟合、预测并计算特征重要度;以B737-800机型一次北京—乌 鲁 木 齐的飞行任务为例,对方法的有效性和可行性进行验证。结果表明:本文提出的可靠性评估方法解决了航空发动机运行过程中数据量大、维度高导致的数据处理困难问题。
引言
航空发动机被誉为“工业之花”,是飞机的核心部分,运行在高温、变载荷等极端条件下,其正常运行可以保证飞机的性能及可靠性。随着技术不断迭代发展,长时间的实验实现难度较大且成本较高,基于故障数据的传统可靠性分析方法受到了限制。在这种背景下,面向飞行任务的航空发动机运行过程中的可靠性分析受到广泛关注。运行可靠性基于运行过程中每台发动机监测的信息,考虑运行过程中多因素影响,搭建运行可靠性模型,计算其运行过程中的可靠性。对于航空发动机而言,其运行可靠性定义为:在规定的运行时间内,规定的运行条件下,完成运行过程中规定功能的能力。由于航空发动机具有可靠性高、失效样本不足、试验费用高昂等特点,同时不同架次、不同机型、不同航线运行的发动机故障及性能退化并不相同,每一台发动机的可靠性对于运营商和主机厂都十分重要。
国际民航组织(International Civil Aviation Or‐ganization,简称ICAO)在安全管理体系中指出,危险的识别应该是积极而具有前瞻性的,有必要积极查明尚未发生的危害;美国联邦航空管理局(Federal Aviation Administration,简称FAA)提出了安全性“监视/数据分析”过程。然而,航空组织尚未提供具体的航空发动机运行可靠性实施方法。运行可靠性除了考虑时间相依的概率外,还需考虑设备自身健康状况、外部环境、系统运行条件和系统运行行为等因素的影响。长期以来,飞行数据的记录与获取并不规范,基于运行数据的可靠性研究并不充分。近年来,随着先进的传感器技术、数据采集及传输技术的发展,在一定程度上为结合运行数据的航空发动机运行安全评估创造了条件。国内外研究者通过数据分析的方法对航空器运行可靠性开展了初步的研究,H.Lee等使用飞行数据记录器的传感器数据来预测可能发生的飞行性能异常,提出了一个发动机健康监测框架,用于检测性能异常从而保障系统安全性;C.Petcharin等针对随着时间推移发动机可靠性下降问题,基于CF6发动机开展了运行可靠性和维护优化研究;洪骥宇使用深度学习算法,依托复杂可靠性与运行可靠性分析理论,研究了状态参数与航空发动机运行可靠性之间的时变、非线性问题;周媛基于数据驱动方法,围绕航空大数据问题,开展了发动机数据采集及状态监测过程中的诸多问题研究,其中关于状态监视、数据重构、退化模式识别三个方面的研究具有很高的指导价值;陈保家等为了提高少失效或零失效数据条件下的航空发动机轴承运行可靠性评估精度和可信性,提出了一种基于比例协变量模型和Logistic回归模型混合的可靠性评估方法;孙闯等针对小样本条件下的航空发动机运行可靠性评估提出了有效手段;赵军等基于典型的民航发动机的飞行快速存取记录器(Quick Access Re‐corder,简称QAR)数据,对案例发动机进行性能分析。为了实现对研究对象的运行条件、工作状态、可靠性裕度等方面的综合评价,冯蕴雯等面向飞机运行过程,应用智能算法开展了航空发动机运行可靠性、运行安全性研究,达到了较好的效果。然而,由于航空发动机运行过程中所涵盖的数据具有类型多、数量大、时变、强耦合、非线性等特点,导致航空发动机运行可靠性分析的效率和精度还不够高。
为了合理解决上述问题,本文提出一种航空发动机运行可靠性评估方法。结合航空发动机工作特性、航空发动机工作状态、飞机运行状态及外部环境等多重因素评估航空发动机运行过程中动态温度裕度以体现运行可靠性;将随机森林算法和分层抽样法结合后对运行数据进行分析,计算各特征重要度;以某型号飞机一次北京—乌 鲁 木 齐的飞行任务为例对所提出方法进行验证。
1 随机森林与分层抽样法结合
1.1 随机森林
(1)首先,采取等权重有放回随机抽样方式,在Dn中抽取数量相等的n个数据点,为构造树做准备工作,称为bootstrap采样。
(2)然后,分别在步骤(1)中得到的数据集中构造决策树。对节点而言,从D个特征中抽取m个特征(m<d< span="">)构成特征子空间,随后从中选择分裂点和分裂特征。对于回归问题选择最大均方差下降作为参照;对于分类问题选择最大不纯度下降作为参照。对以上过程进行循环,直至停止条件,用以逐一构建树节点。
(3)最后,独立地预测各个基分类器决策树,采用多数投票的方式,在各个树的结果基础上,计算得出最后的结果。
一般情况下,研究人员常选用为均方差、均方根误差和绝对平均误差来评价RF在回归分析过程中结果的好坏,三个评价指标分别用MSE、RMSE和MAE表示。三个评价指标的计算公式如式(1)~式(3)所示。
式中:N为训练集的样本数;yi为RF训练中的实际值;为RF训练中的预测值。
本文中,决定系数γ2用于评估RF的拟合效果,其值越大,拟合结果越优(γ2<1),其计算如式(4)所示。
式中:y i为RF训练中的实际值;ŷi为预测值;yˉi为期望值。
然而,当高维数据多、特征数量大时,真实有用的信息特征的占比会少,易导致简单随机抽样方法创建的特征子空间不包含有用信息的特征。因此会造成构建的决策树的性能低,对决策树的性能产生影响,导致RF的性能也随之降低。为了优化这个问题,本文中将分层抽样法与随机森林算法结合。
1.2 随机森林算法结合分层抽样法
为了获得具有代表性的数据样本,分层抽样(Stratified Sampling)法通过引入分层变量的方式将数据分成若干个子组,依据子组与目标样本的大小比例进行随机抽样。
本文采用基于主成分的规则将特征集划分为若干子集。将变换后的特征集用累积特征值比率的方式划分为信息量多和少两部分,其中主成分和特征值一一对应。假设已经按降序排列的协方差矩阵的特征值为λ1,λ2,…,λF(l),则累积特征值比率R定义为
式中:R为若保留前r个特征值,保留数据中的100R%的差异。
基于累积比率R,把前r个特征值对应的特征分配给A 1,作为信息丰富的部分。将后F(l)-r个特征值对应的特征分配到A 2,作为信息较少的部分。从A 1和A 2两个部分随机选择特征进行子空间的分层抽样,如式(6)~式(7)所示。
式中:p为子空间的特征数;D 1为A 1中的特征数量;p1为A 1的特征数;p2为A 2的特征数。
将两部分特征合并形成用于构建树的特征子空间。通过上述过程,各节点的子空间包含丰富的信息且其特征含信息量较少,进而构建出较优的树。
通过随机森林算法与分层抽样法结合,增加了基本决策树的强度和决策树之间的差异性,可以提升随机森林算法在高维数据下的性能。
2 运行可靠性分析方法
2.1 特征提取
QAR记录数据量大,参数广且频率高,通常认为QAR数据用于日常运行监控。随着快速发展的无线QAR传输技术逐渐得到应用,QAR数据的分析与应用方法受到研究者的重视。
表1 3类因素及11个特征
2.2 运行可靠性评价
以往研究认为,监视及预测气动热力性能参数在航空发动机状态监控领域十分重要。结合前述航空发动机运行可靠性影响因素及特征的提取,本文以瞬态排气温度裕度RT来表示飞机运行过程中发动机的运行可靠性,如式(8)所示。
式中:T为随时间变化的排气温度;T a为许用排气温度。
运行可靠性分析流程如图1所示。
图1 运行可靠性分析流程图
3 案例分析
本文以B737-800飞机为例,基于某航空公司北京—乌 鲁 木 齐一次航班的QAR数据,进行航空发动机运行可靠性研究,提取包含3类因素11个子特征的QAR数据。B737-800配备了两台CFM 56-7B发动机,该发动机性能优良且传感器丰富。根据第1节中介绍的运行可靠性分析方法,先提取影响发动机运行可靠性的特征并依据指标RT进行运行可靠性评价;结合评价结果,采用结合分层抽样的随机森林法进行拟合、预测;随后对提取的11个特征进行重要度评价并总结航空发动机运行可靠性规律。
3.1 运行可靠性
以排气温度裕度RT表示航空发动机运行可靠性,M表示从QAR数据中提取的3类因素11个子特征的值的集 合,RT与M的关系可以表示为
在本案例中,设定许用排气温度T a取值为950℃,结合所提取的QAR数据,依据提出的航空发动机运行可靠性分析方法,对案例航班任务过程中航空发动机的时变排气温度裕度RT进行计算,结果如图2所示(其中1 kn=0.514 444 m/s)。
图2 特征时序图
运行过程中的排气温度裕度如图3所示。
图3 运行过程中的排气温度裕度
在时刻8∶55至9∶00期间RT值较高,此阶段为起飞之前,低压转子和高压转子转速较低,排气温度值较低,排气温度裕度值在0.55附近;随后飞机进入起飞阶段,此时低压转子和高压转子转速处于高值(在95%rpm附近),期间燃油流量大、滑油温度高、排气温度高,排气温度裕度在0.15~0.25之间,数值较小且波动较大。在时刻9∶20至12∶15期间,飞机处于巡航阶段,气压高度保持在36 000 ft(1 ft=0.304 8 m)附近,此时飞机运行平稳,低压转子转速、高压转子转速、燃油流量和排气温度等较起飞阶段有所降低,排气温度裕度较起飞阶段有所提高。
时刻12∶15之后飞机处于下降阶段,此时舱外温度不断升高,计算空速、气压高度、马赫数不断降低。由图2(c)、图2(d)显示的左右迎角和高、低压转子转速变化可知,在此区间内,飞机姿态调整频繁,转子转速不断变化,排气温度不断变化,导致排气温度裕度变化剧烈。但是,此区间内排气温度裕度均值较高,为0.4~0.65,这是由于在降落阶段飞机阶梯式下降,对发动机动力需求相对较小。
3.2 拟合分析
在上述提取的运行数据中,以时间为序随机抽取5 000组数据,其中3 750组数据用于创建训练样本,1 250组数据用作测试样本。计算结果如图4所示。
图4 排气温度裕度的预测结果
各特征对于排气温度裕度的重要度计算结果如图5所示,可以看出:对排气温度裕度影响最大的前三个特征分别是左发n2、左发n1和运行时间;航空发动机排气温度裕度与发动机当前工作状态因素中的高压转子转速、低压转子转速以及飞机运行状态中的运行时间关联性最大。这是由于一方面高低压转子转速从侧面体现了发动机运行功率;另一方面飞机运行过程中按照航空公司的计划进行飞行,导致运行时间与排气温度相关度较大。此外,对航空发动机排气温度裕度影响较小的三个特征分别为舱外温度、右侧迎角和左侧迎角。综合实际运行经验,以上关于排气温度裕度的特征重要度分析具有合理性。
图5 排气温度裕度的各特征重要度
根据拟合结果,结合式(1)~式(4)得出结合分层抽样的森林算法分析的平方平均误差为1.501 6×10-5,均方根误差为0.003 9,绝对平均误差为0.002 4,决定系数γ2为0.980 1。
通过传统随机森林算法进行拟合计算,其中,传统随机森林算法可参照叶博嘉等[19]关于机器学习算法的研究。拟合计算结果通过式(1)~式(4)得出平方平均误差为9.231 0×10-5,均方根误差为0.021 0,绝对平均误差为0.014 8,决定系数γ2为0.972 2。
结合分层抽样的随机森林性能验证结果如表2所示。
表2 结合分层抽样的随机森林性能结果
从表2可以看出:相较于传统随机森林算法,结合分层抽样的随机森林算法拟合结果的MSE、RMSE和MAE值均变小,决定系数γ2更接近于1,相较于传统随机森林算法拟合结果有了明显提升。综上所述,通过结合分层抽样的随机森林算法拟合精度得到提高。
4 结 论
(1)本文提出了一种支持评估飞机任务过程中航空发动机运行可靠性的方法。所提方法考虑当前运行环境、飞机瞬时状态、发动机当前工作状态3类因素,将随机森林算法与分层抽样法有机结合对数据进行拟合、预测并计算特征重要度,在一定程度上解决了运行数据量大、维度高导致的数据处理困难问题。
(2)对航空发动机运行可靠性影响较大的前三个特征分别是高压转子转速、低压转子转速和运行时间。
(3)本文所提出的方法可为航空发动机运行可靠性评估提供理论支撑。为制定飞机维修计划和综合保障方案提供一定的参考。