0 引言
高铁的信息控制系统[1]是一个大型复杂的工程系统,与乘客的个人安全息息相关,对系统可靠性具有非常高的要求.牵引系统[2]是高铁信息控制系统中的最核心单元,承担为动车组提供可靠牵引动力的职能.因此,保障牵引系统安全高效的运行具有重要意义,实现高铁牵引系统的剩余寿命预测迫在眉睫.
剩余寿命预测一般根据系统机理或失效数据,建立其退化趋势的模型,预测其从当前时刻到失效时刻的时间间隔[3].近年来,剩余寿命预测技术发展迅速,现有的剩余寿命预测技术主要有三种[4]:模型驱动[5]、数据驱动[6]以及混合[7]的方法.高铁牵引系统较为复杂,难以建立准确的数学模型,因此,采用数据驱动的方法进行剩余寿命预测更为可行.数据驱动的寿命预测方法主要通过统计学习、机器学习等方法分析设备的传感器监测的失效数据,建立其退化模型.
在实际应用中,数据驱动的剩余寿命预测方法主要包括:直接剩余寿命预测[8-10]、基于回归的剩余寿命预测[11-14]、基于退化状态的剩余寿命预测[15].
直接剩余寿命预测从监测数据中提取具有退化趋势的特征,建立特征与设备剩余寿命的对应关系,预测时,利用新的数据通过该对应关系即可得到相应的剩余寿命,但其对数据平滑性、单调性要求较高,对噪声较为敏感.基于回归的剩余寿命预测利用监测数据,构建出设备的健康度指标,再通过回归方法(如维纳过程[11]、ARIMA模型[12]、随机森林回归[13]等)预测其到达失效阈值的时刻,进而实现寿命预测,此方法需要专家知识确定失效阈值.基于退化状态的剩余寿命预测将系统的健康状态分级,估计当前系统的健康状态以及到达失效状态的时间.
目前针对高铁牵引系统的预测方法[16-18]不多,主要集中在变压器、变流器、电机、传动轴承等部件.文[16]利用闭环键合图模型确定贝叶斯网络的结构,然后通过受限玻尔兹曼机进行更深层特征的提取,实现了变流器中间电路电容性能退化的预测.针对拟合优而外推差的问题,文[17]组合多个单一预测方法,并结合支持向量机实现了变压器故障的预测.文[18]提出了基于剩余寿命预测模型的电子器件故障预测方法.
现有方法需要较多的专家知识,需要对系统的物理机理有着较深的理解,但在实际应用中,此过程需要大量的人力、物力以及时间,实现较为困难.针对上述问题,本文采用基于退化状态的寿命预测策略,并提出一种基于SVM-LSTM模型的寿命预测方法.与一般方法相比,该方法既进行了健康状态评估,节省了不必要的检测与维护费用,又能预测系统的退化轨迹以及剩余使用寿命,为系统的维护提供决策信息.最后,在半物理实验平台上验证了该方法的有效性,并展示出了优越的性能.
1 高铁牵引系统与半物理实验平台 1.1 高铁牵引系统高铁牵引系统主要由受电弓、牵引变压器、牵引变流器、牵引电机、齿轮传动等结构组成,图 1为CRH2牵引传动系统组成原理图.列车在牵引运行时,受电弓将接触网AC 25 kV单相工频交流电,经过相关的高压电器设备传输给变压器,变压器降压输出1 500 V单相交流电供给变流器,通过变流器的作用,将单相交流电转化为电压频率均可调的三相交流电,进而为牵引电机提供动力来源,牵引整个列车.
1.2 高铁牵引系统半实物仿真平台高铁在实际运行时,牵引系统发生故障代价较高,为了获取故障数据,中车株洲电力机车研究所有限公司与中南大学联合开发了CRH2牵引系统仿真平台[19],能够模拟实际列车的启动、平稳运行以及故障状态.该平台模拟了高铁牵引系统中的变压器、变流器(包括整流器、中间电路、逆变器)、牵引电机等环节,其拓扑结构如图 2所示. 图 3为牵引系统仿真平台的结构图,主要包括上位机、信号调理器、传动控制单元、dSPACE等部件.
1.3 性能退化模拟本文以中间电路电容性能退化为例,验证SVM-LSTM算法.
电容性能退化[19]的注入公式如下:
(1) |
其中,C为正常电容容值,t为仿真时间,tdegra为注入故障时间,a为电容的退化参数,Cdegra为退化后的电容容值.本文以0.01为退化参数,采集了40组列车平稳运行时电容退化的实验数据,该数据提供了中间电路电压上电压、下电压(Ucd1、Ucd2)、三相电流(Ia、Ib、Ic)、电机转矩(Toq)等变量.该平台具有触发保护功能,当系统退化至一定程度时,便会触发保护,进入失效状态.
2 多维退化特征提取高铁牵引系统失效是由多个变量动态变化且相互耦合的结果,如中间电路电压、三相电流、电机转矩、电机转速等皆有可能导致系统失效.对于已有的退化参数,需要充分利用,以便提取能表征系统退化性能的特征,进而实现高铁牵引系统的剩余寿命.
2.1 特征提取与特征选择针对不具有良好趋势性的性能退化参数,本文采用常见的统计特征[9]对原始信号进行特征提取,主要包括:均值、绝对均值、有效值、平均功率、方根幅值、最大值、峰峰值、方差、标准差、偏斜度、峭度、波形指标、峰值指标、脉冲指标、裕度指标、偏斜度指标、峭度指标等时域特征;重心频率、均方频率、均方根频率、频率方差、频率标准差等频域特征.
特征提取后的各个特征并不一定能表征系统的退化性能.具有良好退化趋势性的特征能较好的反应系统的退化行为,而其他的特征则不能反应系统的退化,引入这些特征不仅降低了寿命预测算法的精度,也大大影响了算法的运行速度.因此,需要对提取出的特征进行选择,获取最能体现性能退化的特征信息.特征选择的主要任务是选择单调性较好、与期望值相关性较强的特征,剔除冗余、不相关的特征.
本文使用单调性指标Mono[14]、相关性指标Corr[20]、冗余性指标Redu来进行特征选择.单调性指标反应了特征的趋势性,相关性指标反应了特征与剩余寿命之间的关联性,冗余性反映了特征间的独立性.各个指标的计算公式如下:
(2) |
其中,dF为特征序列的一阶微分,l为特征序列的长度. Mono=1表示该特征完全单调,否则该特征为震荡.
(3) |
其中,di为该特征第i个值与剩余寿命的秩次差(若fi、ri分别为该特征第i个值与对应的剩余寿命,记a、b为fi、ri按照从大到小排列的所在的位置,则a、b为变量fi、ri的秩次).当Corr=0时表示特征与剩余寿命不相关,当Corr=1时表示特征与剩余寿命密切相关.
良好的特征要满足单调性好、相关性强等特性,因此本文采用Mono、Corr线性组合Cri[14].
(4) |
当某一特征的Cri大于m时,选择该特性,否则舍弃,其中m为可调参数.
提取单个信号的多个统计特征时,提取的特征很大程度上具有较强的相关性,导致提取的特征冗余性较高,即含有的冗余信息较多.冗余信息不仅影响算法的运行速度还可能影响算法的最终效果,因此利用了冗余性指标Redu进行特征的冗余性判断.
(5) |
其中,s为经过Cri指标选择的特征集,可能包括多个特征,a、b为特征集s中的任意两个不同特征,fa、fb分别为特征a、b的均值. Redu(a,b)=1表示特征a、b之间是线性相关的,否则表示特征a、b之间是相互独立的.若特征集s中存在特征使Redu>u,那么该特征集包含冗余信息,将满足Redu>u的特征归为同一类别,选择每一类别中Cri最大的特征组成特征集,该特征集不包含冗余信息,其中u为可调参数;若特征集s中任意两个特征的Redu均满足Redu < u,那么则可以认为该特征集不包含冗余信息.
2.2 结果分析图 4、图 5分别为中间电路上电压信号Ucd1、电机转矩信号Toq原始信号.部分原始信号单调性较差,利用特征提取与特征选择方法对原始信号进行处理,其中特征提取的窗口长度为100,每个窗口作为一个cycle,具体过程如下所述.
以电机转矩为例:
首先,确定特征提取窗口长度,提取电机转矩信号的时域、频域特征,部分特征如图 6、图 7所示.
然后,根据指标Cri,选择单调性好、相关性强的特征,图 8为电机转矩各个特征的Cri,本文取m=0.5,因此选择特征8、9、12,即方差、标准差、波形指标.
最后,对选择的三个特征进行特征间的相关性判断,计算两两特征间的相关性,结果如下.
Redu(8,9)=0.9980
Redu(8,12)=0.9998
Redu(9,12)=0.9978
其中,括号内的数字表示特征的编号(即8代表特征8),将相关性较强的特征归为一类.本文取u=0.9,根据式(5),特征集中包含冗余信息,特征8、9、12具有较强的相关性,因此将其归为一类特征,再选择Cri值最大的特征,即为波形指标.
对每次原始信号重复上述过程,选择出单调性好、相关性强且冗余性小的特征,最终选择了Ucd1有效值、Ucd2有效值、Ia峰值、Ib峰值、Ic峰值、Toq波形指标.
3 基于SVM-LSTM模型的高铁牵引系统寿命预测基于SVM-LSTM模型的寿命预测过程如图 9所示.给定一段原始信号数据DJ×K,其中,J为数据维度,表示原始信号变量的个数,K为窗口长度.经过对原始数据进行特征提取与特征选择,得到FU×1,其中U表示特征维度,1表示特征长度,即每K个数据,取一个点.以FU×1作为输入,使用SVM算法进行健康状态评估,判断系统所处的健康状态.根据需要,对系统的健康状态进行分级,本文将系统的健康状态分为3个状态:正常、退化、失效.若评估结果为正常或者失效,则不进行预测,直接输出系统状态,否则将其作为LSTM网络的输入,预测退化过程.将LSTM网络的输出作为SVM的输入,即可判断系统在下一时刻的健康状态.当下一时刻的健康状态为失效时,预测过程结束,预测步长则为系统的剩余寿命,否则继续进行退化过程的预测,直到达到其停止条件.
3.1 SVM健康状态评估SVM是一种基于结构风险最小化的分类器,因其在小样本学习以及非线性问题上的出色能力,被广泛应用于故障诊断、故障检测[23]等领域.在解决非线性问题时,其基本思想是首先将低维线性不可分数据映射到高维线性可分空间中,在高维空间中寻找一个最大间隔超平面,以该超平面为分类器,将样本空间内不同类别的样本分开.本文使用SVM算法进行系统的健康状态评估,其核心思想是给定健康状态标签将原始数据分类. SVM[22]算法介绍如下.
给定训练样本集S={xi,yi}i=1n,yi∈{-1,+1},其中xi是第i个样本的属性,yi是第i个样本的标签,n是样本的数目.在样本空间中,最优超平面可由如下方程描述:
(6) |
其中,ω为法向量,决定了超平面的方向,b为位移项,决定了超平面与原点的距离,ϕ(x)表示将x映射后的特征向量.
求解最优超平面,即求解如下最优化问题.
(7) |
可以利用拉格朗日乘子法转换求其对偶问题,求解后即可得到最优超平面方程:
(8) |
其中,κ(xi,xj)为核函数,满足:
(9) |
循环神经网络(recurrent neural network,RNN)是一种专门用于处理序列数据的神经网络,其当前时刻隐藏层状态不仅取决于当前时刻的输入,还与上一时刻的隐藏层状态有关,能有效的利用历史信息进行预测.因其在处理长期依赖性问题上的出色能力,被广泛应用于时间序列预测领域[9, 14].但当序列长度较长时,标准循环神经网络容易出现梯度消失等问题,进而造成记忆缺失现象,即不能有效利用历史信息.为了避免这个问题,本文使用RNN的变体LSTM[21]进行时间序列预测.与RNN相比,LSTM增加了一个状态c,用来保存长期的状态,LSTM解决问题梯度消失问题的关键就是如何保存长期状态c.为此,LSTM使用三个控制开关,分别用来保存长期状态c、将当前状态输入到长期状态c以及是否将长期状态c输出. 3个开关的作用如图 10所示:
LSTM利用3个控制门来实现控制开关的作用.控制门本质上就是一层全连层神经网络,它的输入、输出均是一个实数向量,激活函数为Sigmoid,因此输出的向量各个值的范围在0-1之间. LSTM利用遗忘门、输入门来控制长期状态c的内容.其中,遗忘门负责上一时刻的状态ct-1有多少信息保留到当前时刻的长期状态ct;输入门负责当前时刻网络的输入xt有多少信息保存到长期状态ct.另外,LSTM用输出门来负责状态ct的输出,即控制有多少信息传输至输出ht. LSTM网络结构如下图 11所示.
具体计算公式如下:
(10) |
(11) |
(12) |
(13) |
(14) |
(15) |
式(10)~(15)表明,LSTM网络能充分利用历史信息的同时,也能抛弃冗余、无用的信息.
3.3 模型评价指标模型评价主要是通过多种评价指标,来判断模型对测试集中所有样本的测试性能.
本文使用三种广泛应用于剩余寿命预测效果评价的指标,包括平均绝对误差(mean absolute error,MAE)、均方根误差(mean square error,MSE)、平均绝对百分百误差(mean absolute percentage error).各项指标计算方式如下:
(16) |
(17) |
(18) |
其中,rk为第k个样本的预测的剩余寿命,Rk为第k个样本真实的剩余寿命,K为测试样本总数. MAE、MAPE、MSE越低,表示预测误差越小,预测精度越高.
3.4 结果与分析经过特征提取和特征选择过程后,还需要对数据进行标准化、降噪处理,本文使用局部加权线性回归算法进行数据的降噪.
训练SVM时,需要将特征数据分为三类.本文所使用的中间电路电容性能退化数据为全寿命数据,包含系统正常、退化以及失效的全过程.在数据的初始部分,系统仍处于正常运行状态;在数据的中段部分,系统属于缓慢退化状态;在数据的末尾部分,系统已经处于严重退化状态,甚至到达失效状态,各个性能参数几乎不变.因此本文将初始5%时刻的数据作为健康数据,最后5%时刻的数据作为失效数据,其它的作为退化数据.另外,经过多次试验确定,SVM的输入参数为每个特征的值和对应特征的一阶微分.利用该特征数据训练LSTM网络,进行特征退化趋势预测.因高铁牵引系统变量之间相互影响,因此,同时进行多个特征的退化趋势预测,即LSTM网络的输入维度即为特征维度.经历完上述过程之后,即完成SVM-LSTM模型的训练.
预测时,将特征数据输入SVM-LSTM模型中,首先判断当前时刻系统所处状态,若为退化状态,则进行退化趋势预测,以预测的结果作为系统下一时刻的特征数据,判断系统下一时刻所处状态,重复该过程,直到判断系统状态为失效,预测步长即为剩余使用寿命. 图 12、13展示了测试样本1的退化过程的预测结果,图 14~17展示了部分测试样本的RUL预测结果.
由图 12、13可以看出,该方法能够实现退化趋势的预测.从图 14~17中可以明显看出该方法预测的剩余寿命与真实剩余寿命十分接近,显示了对牵引系统中间电路电容性能退化的良好预测性能.为了更直观的描述结果,表 1列出了预测结果的各项指标,并与文[12-13]等方法进行比较.
从表 1中结果可以看出,本文提出的方法在MAE、MSE上都明显优于文[12-13],但在MAPE上,优势却不那么明显,主要由于该方法在最后时刻的预测误差较大,从而导致MAPE较高,因此本文提出的方法更适用于在退化过程初期开始预测.
4 结论本文针对高铁牵引系统退化参数众多、结构较为复杂等特点,提出了一种以监测数据为基础、无需建立复杂模型且能够处理多变量退化的剩余寿命预测方法.该方法既能够预测性能退化趋势,又能预测系统最终的剩余寿命,尽管在退化过程末期预测性能较差,但考虑到实际系统在处于严重退化过程时,可靠性较低,因此该方法仍具有一定的实用性.但本文目前只考虑了单工况下的子系统退化情况,未来期望能够针对多工况的系统级退化做出良好的预测.
[1] |
张曙光.
CRH2型动车组[M]. 北京: 中国铁道出版社, 2008.
Zhang S G. CRH2 electric multiple unit[M]. Beijing: China Railway Publishing House, 2008. |
[2] | Lu X S, Li Y F, Wu M L, et al. Rail temperature rise characteristics caused by linear eddy current break if high-speed train[J]. Journal of Traffic and Transportation Engineering(English Edition), 2014, 1(6): 448–456. DOI:10.1016/S2095-7564(15)30295-6 |
[3] |
张妍, 王村松, 陆宁云, 等.
基于退化特征相似性的航空发动机寿命预测[J]. 系统工程与电子技术, 2019, 41(16): 1414–1421.
Zhang Y, Wang C S, Lu N Y, et al. Remaining useful life prediction for aero-engine based on the similarity of degradation characteristics[J]. Systems Engineering and Electronics, 2019, 41(16): 1414–1421. |
[4] |
胡昌华, 施权, 司小胜, 等.
数据驱动的寿命预测和健康管理技术研究进展[J]. 信息与控制, 2017, 46(1): 72–82.
Hu C H, Shi Q, Si X S, et al. Data-driven life prediction and health management:State of the art[J]. Information and Control, 2017, 46(1): 72–82. |
[5] | Ungurean L, Carstoiu L, Micea M V, et al. Battery state of health estimation:A structured review of models, methods and commercial devices[J]. International Journal of Energy Research, 2016, 41: 151–181. |
[6] |
彭宇, 刘大同.
数据驱动故障预测和健康管理综述[J]. 仪器仪表学报, 2014, 35(3): 481–495.
Peng Y, Liu D T. Data-driven prognostics and health management:A review of recent adcances[J]. Journal of Instrumentation, 2014, 35(3): 481–495. |
[7] | Liao L X, Kottig F. Review of hybrid prognostics approaches for remaining useful life prediction of engineered systems, and an application to battery life prediction[J]. IEEE Transactions on Reliability, 2014, 63(1): 191–207. DOI:10.1109/TR.2014.2299152 |
[8] | Khelif R, Chebel-Morello B, Malinowski S, et al. Direct remaining useful life estimation based on support vector regression[J]. IEEE Transactions on Industrial Electronics, 2017, 64(3): 2276–2285. DOI:10.1109/TIE.2016.2623260 |
[9] | Wang C S, Lu N Y, Wang S L, et al. Dynamic long short-term memory neural-network-based indirect remaining-useful-life prognosis for satellite lithium-ion battery[J]. Applied Sciences, 2018, 8(11): 2078. DOI:10.3390/app8112078 |
[10] | Ordone C, Lasheras F S, Pardoinas J R, et al. A hybrid ARIMA-SVM model for the study of the remaining useful life of aircraft engines[J]. Journal of Computational and Applied Mathematics, 2019, 346: 184–191. DOI:10.1016/j.cam.2018.07.008 |
[11] |
邓超, 陶志奎, 吴军, 等.
基于性能退化的数控机床剩余寿命预测[J]. 机械工程学报, 2018, 54(17): 181–189.
Deng C, Tao Z K, Wu J, et al. Residual life prediction for NC machine tool based on performance degradation[J]. Journal of Mechanical Engineering, 2018, 54(17): 181–189. |
[12] | Ordonez C, Lashera F S, Pardinas J R, et al. A hybrid ARIMA-SVM model for the study of the remaining useful life of aircraft engines[J]. Journal of Computational and Applied Mathematics, 2019, 346: 184–191. DOI:10.1016/j.cam.2018.07.008 |
[13] | Zhong S S, Xie X L, Lin L. Two-layer random forests model for case reuse in case-based reasoning[J]. Expert Systems with Applications, 2015, 42(24): 9412–9425. DOI:10.1016/j.eswa.2015.08.005 |
[14] | Guo L, Li N P, Jia F, et al. A recurrent neural network based health indicator for remaining useful life prediction of bearings[J]. Neurocomputing, 2017, 240: 98–109. DOI:10.1016/j.neucom.2017.02.045 |
[15] | Ramasso E, Rombaut M, Zerhouni N. Joint prediction of continuous and discrete states in time-series based on belief functions[J]. IEEE Transactions on Cybernetics, 2013, 43(1): 37–50. DOI:10.1109/TSMCB.2012.2198882 |
[16] | Zhang C Y, Lu N Y, Wang C S, et al. An RBMs-BN method to RUL prediction of traction converter of CRH2 trains[J]. Engineering Application of Atrificial Intelligence, 2019, 85: 46–56. DOI:10.1016/j.engappai.2019.06.001 |
[17] |
赵文清, 朱永利, 张小奇.
应用支持向量机的变压器故障组合预测[J]. 中国电机工程学报, 2008, 28(25): 17–19.
Zhao W Q, Zhu Y L, Zhan X Q. Combinational forecast for transformer faults based on support vector machine[J]. Proceeding of CSEE, 2008, 28(25): 17–19. |
[18] |
孙博, 赵宇, 黄伟, 等.
电子产品健康监测和故障预测方法的案例研究[J]. 系统工程与电子技术, 2007, 29(6): 1012–1016.
Sun B, Zhao Y, Huang W, et al. Case study of prognostic and health management methodology for electronics[J]. Systems Engineering and Electronics, 2007, 29(6): 1012–1016. DOI:10.3321/j.issn:1001-506X.2007.06.042 |
[19] | Yang C, Yang C, Peng T, et al. A fault-injection strategy for traction drive control systems[J]. IEEE Transactions on Industrial Electronics, 2017, 64(7): 5719–5726. DOI:10.1109/TIE.2017.2674610 |
[20] | Lei Y G, Li N P, Gontarz S, et al. A model-based method for remaining useful life prediction of machinery[J]. IEEE Transaction on Reliability, 2016, 65(3): 1314–1326. DOI:10.1109/TR.2016.2570568 |
[21] | Hochreiter S, Schmidhuber J. Long short-term memory[J]. Neural Computation, 1997, 9(8): 1735–1780. DOI:10.1162/neco.1997.9.8.1735 |
[22] | Vapnik V.. Vapnik, The nature of statistical learning theory[M]. Berlin, Germany: Springer, 1998. |
[23] | Chen K Y, Chen L S, Chen M C, et al. Using SVM based method for equipment fault detection in a thermal power plant[J]. Computers in Industry, 2011, 62(1): 42–50. DOI:10.1016/j.compind.2010.05.013 |