文章快速检索  
  高级检索
基于动态全主成分回归质量相关的故障检测
王光1, 孙程远1, 尹珅2     
1. 渤海大学工学院, 辽宁 锦州 121000;
2. 哈尔滨工业大学航天学院, 黑龙江 哈尔滨 150001
摘要: 针对具有动态特性的质量相关的故障检测问题,提出了一种基于自回归移动平均模型(auto-regressive moving average exogenous,ARMAX)的动态全主成分回归(dynamic total principal component regression,DT-PCR)方法.该方法基于输入的时滞值,形成增广输入矩阵;然后将形成的增广矩阵分解成质量无关和质量相关两个正交部分,并根据这两个部分对应子空间的统计量设计出一个更简单的故障诊断策略.该方法对于输出的预测精度也优于以往的方法.最后,通过一个数值例子和田纳西—伊斯曼过程将DT-PCR与全潜结构投影模型(total partial least squares,TPLS)进行对比,验证了DT-PCR的输出预测性能及与质量相关的故障检测性能.
关键词: 故障检测     输出预测     质量相关     动态系统    
Quality-related Fault Detection Approach Based on Dynamic Total Principal Component Regression Component Regression
WANG Guang1, SUN Chengyuan1, YIN Shen2     
1. College of Engineering, Bohai University, Jinzhou 121000, China;
2. School of Astronautics, Harbin Institute of Technology, Harbin 150001, China
Abstract: On the basis of the structure of auto-regressive moving average exogenous (ARMAX), we propose a dynamic total principal component regression (DT-PCR) method for dynamic performance of quality-related fault detection. We form the input augmented matrix in the method based on the delay value of the input. The augmented matrix is divided into two orthogonal parts, namely, quality-related and quality-unrelated. We design a simple fault detection strategy based on statistics in two subspaces that correspond to the two parts. The output prediction accuracy of DT-PCR is better than that of former methods. The prediction and fault detection performance of the proposed approach are proved by a numerical example and the Tennessee Eastman process through a comparison by using total partial least squares (TPLS).
Key words: fault detection     output prediction     quality-related     dynamic system    

1 引言

近年来,基于数据驱动技术的故障检测方法一直是一个热门话题[1-2].不同于以往的故障检测方法,数据驱动技术[3-4]从传感器获得大量的数据并构建故障检测策略,对系统没有太多要求.同时,现代工业系统的数据中往往蕴含着大量的信息,数据驱动技术可以有效地进行故障检测[5-6].在数据驱动的故障检测方法中,多元统计分析方法[7-8]依托于统计学原理,可以更好地应用到复杂系统的故障检测中.在故障检测技术中,根据质量和过程变量之间的关系进行质量相关的故障检测[9-11]可以避免不必要的停产检修等问题.

在多元统计分析的方法中,主成分分析(principal component analysis,PCA)[12-13]和偏最小二乘(partial least squares,PLS)[14-15]是两个常见的统计方法.标准PLS对过程测量执行斜分解,把它们分成主成分和残差部分,进行质量相关的故障检测.然而,过程测量的残差部分也可能与输出有关,使其对质量相关的故障检测结果不准确.为了解决这个问题,Zhou等[10]提出了一种后处理方法,称为全潜结构投影模型(total partial least squares,TPLS).接着,Yin等[11]提出(modified partial least squares,MPLS)用以解决质量相关的故障检测问题.结合上述两种方法,Qin等[12]提出(current partial least squares,CPLS).然而,实际工业系统通常是具有动态性和复杂性的动态系统[16-18].以往的方法不能准确建立输入矩阵X和输出矩阵Y之间的关系模型.为了解决这个问题,一个可行的方法是使用ARMAX模型[17].

本文基于PCA方法和ARMAX模型提出一种新的方法,称为动态全主成分回归(DT-PCR)方法,并且基于DT-PCR方法提出一种更简单的故障诊断策略.同时,该方法能准确地建立XY之间的关系模型,并且能够对输出进行精确的预测.最后,采用数值例子及田纳西—伊斯曼过程将DT-PCR与TPLS进行对比,证明了DT-PCR故障检测和输出预测的有效性.

2 主成分分析

在工业过程中,假设给定的过程是线性的并且是工作所需的操作点,通过收集正常的过程数据来构建输入和输出矩阵.所有的测量变量遵循正态分布且x~Ν(0,Σx),y~Ν(0,Σy).测量噪声和过程噪声均属于正态分布且nm>l≥1.

XY分别表示输入和输出矩阵:

其中,两个矩阵的列向量分别为xk∈Rmyk∈Rl(k=1,…,n);n代表样本数;ml分别代表输入和输出变量数.

标准的PCA算法为:

步骤1    首先得到输入矩阵的协方差矩阵.

步骤2    对协方差矩阵进行特征值分解,得到特征向量集合R和特征值集合S.

步骤3    接着在R中找到A个最大特征值构建一个新的特征向量集合R,其与SA个最大特征向量相关.

步骤4    T=XP,其中TX的得分矩阵,PX的负载矩阵.

步骤5     ,其中X是主元部分,E是残差部分.

3 动态全主成分回归

对于系统的监测,获取实时变量是十分关键的一步[16].而动态系统的变量十分复杂,使得对系统的监测也变得复杂.动态系统的输出通常为静态变量,而输入为动态变量.根据ARMAX模型[17]得到输入和输出之间的相关性,并基于时滞值形成了新的输入矩阵.为保持输入矩阵行数和输出矩阵列数平衡,构建新的输出矩阵.新的输入矩阵和输出矩阵分别为

(1)

其中,xdk=[s-1yk,…,s-pyks-1xk,…,s-qxk],s-1是单位延迟算子,k=1,…,nqp是时间滞后.输出矩阵的行表示为ρ是遗忘因子.

将初始变量空间投射到一个潜变量空间Tb=[t1,…,tA]∈Rn×A上:

(2)

其中,A代表潜在变量的数量,TbPb分别代表Xb的得分矩阵和负载矩阵,是残差矩阵.

通过TbYb的最小二乘回归关系计算QbT

(3)

即:

(4)

其中Yb的在线预测,Bb=PbQbTXbYb之间的系数矩阵.在上执行PCA算法得到其得分矩阵Tyb和负载矩阵QbT

(5)

因此,Tb可以看作是通过QbTQybTyb再投射.从Tyb中获得Xyb

(6)
(7)
(8)

因此可以得到Xkb=Xb-Xyb,其中XkbXyb分别是与Yb高度相关和不相关矩阵.

本文采用T2统计去监测XkbXyb这两个部分.在Xkb上执行PCA算法,使得其相对应的特征向量为0并消除极小值,得到它的得分矩阵Tkb和负载矩阵Pkb.对于新的样本xnew,它的得分矩阵tnewtnewT=xnewTPb.

tnew再投射得到:

(9)

因此不相关部分的得分矩阵为

(10)

XybT2统计及其相应的阈值为

(11)
(12)

其中Fa(1,n-1)代表置信限为aF统计,其自由度为1和n-1.

同理,设计出XkbT2统计及其相应的阈值为

(13)
(14)

其中Ak=m+1.

本文DT-PCR的检测过程为

离线模型训练:

(1) 基于正常数据和质量数据,构建矩阵XbYb.

(2) 对XbYb评估并标准化为0均值和单位方差.

(3) 基于PCA算法从Xb得到Tb,并计算出Tyb.

(4) 计算出XybXkb,并基于PCA算法,从Xyb得到它的得分矩阵.

(5) 给定置信限并根据式(12)和式(14)设置阈值.

在线故障检测:

(1) 根据式(9)和式(10)得到tynewtknew.

(2) 根据式(11)和式(13)得到Ty2Tk2统计.

(3) 基于故障诊断逻辑进行决策.

DT-PCR的故障诊断策略为:

(1) Ty2 < Jth,y & Tk2 < Jth,k⇒该工业进程无故障发生;

(2) Ty2Jth,y & Tk2Jth,k⇒该工业进程有质量相关的故障发生;

(3) Ty2 < Jth,y & Tk2Jth,k⇒该工业进程有质量无关的故障发生.

4 仿真实验

在本章中,DT-PCR通过两个实验与TPLS进行对比,来证明其输出预测和故障检测的性能.对于输出预测性能的评估公式为

(15)

其中,y是真实值,RMSE为均方根误差,是预测值,Nt为样本数量,MRE为平均相对误差.

4.1 数值例子

该数值例子在文[12]中进行了详细描述,本次实验通过400个样本建立回归模型并采用DT-PCR和TPLS进行对比和分析.本例子模型为

(16)

其中,tn*~Ν(0,22I3),en~Ν(0,0.12I5),vn~(0,0.12I2).

实验结果如图 1图 2所示,得到的MRE和RMSE结果记录在表 1中.根据表 1和式(15)可以得出,DT-PCR对输出的预测性能要优TPLS.

图 1 TPLS的预测值与真实值 Figure 1 The true values and the predicted values of the TPLS
图 2 DT-PCR的预测值与真实值 Figure 2 The true values and the predicted values of the DT-PCR
表 1 DT-PCR与TPLS的RMSE和MRE Table 1 The RMSE and the MRE of the DT-PCR and the TPLS
TPLS DT-PCR
RMSE MRE RMSE MRE
y1 3.94 1.04% 3.57 0.81%
y2 10.14 0.19% 8.69 0.11%

将故障样本添加到系统中,分别采用TPLS和DT-PCR对故障进行检测. TPLS利用Ty2QrTo2Tr2四个统计量去检测故障[10].

故障1    质量无关的故障:

其中,xn*是样本中的无故障值,xf是故障值.

图 3是TPLS的故障检测结果. TPLS的Tr2Qr发出警报,To2Ty2没有发出警报,TPLS能够检测出质量无关的故障. DT-PCR的故障检测结果如图 4所示,Tk2Jth,kTk2统计量发出警报,Ty2 < Jth,yTy2统计量没有发出警报.根据DT-PCR的故障诊断策略可以判断出该故障类别为质量无关,与已知条件相符.

图 3 TPLS在故障1下的故障检测结果 Figure 3 The fault detection results under fault 1 by the TPLS
图 4 DT-PCR在故障1下的故障检测结果 Figure 4 The fault detection results under fault 1 by the DT-PCR

故障2    质量相关的故障:

其中n≥200时,发生故障.其中f=[0  0  15]T.

TPLS的质量相关的故障检测结果如图 5所示. TPLS的Ty2To2Tr2发出警报,Qr没有发出警报,TPLS能够检测出质量相关的故障.当故障2发生时,图 6是故障2下DT-PCR的故障检测结果. Tk2 < Jth,kTk2统计量发出警报,同时Ty2Jth,yTy2统计量发出警报,根据DT-PCR的故障诊断策略可以判断出该故障类别为质量相关,与已知条件相符.

图 5 TPLS在故障2下的故障检测结果 Figure 5 The fault detection results under fault 2 by TPLS
图 6 DT-PCR在故障2下的故障检测结果 Figure 6 The fault detection results under fault 2 by the DT-PCR

TPLS能够成功检测出质量相关和质量无关的故障,但是其统计量较为复杂,用了4个统计量去检测和诊断故障. DT-PCR对于质量相关和质量无关的故障同样能够展现出正确的故障检测结果,其故障诊断策略较为简单,仅用两个统计量去检测和诊断故障.

4.2 田纳西—伊斯曼过程

田纳西—伊斯曼过程(Tennessee Eastman process,TEP)来自于对实际过程的模拟,该仿真平台广泛应用到控制和监测方法中[19-20].

TEP的过程变量可以分为2个部分,一部分有41个测量值,XMEAS模块(1~41),它包括19个采样过程测量值和22个持续的过程测量值.另一部分包括12个操纵变量,XMV模块(1~12).选择33个变量作为输入数据x,其中包括22个过程变量(1~22)和11个可用变量(1~11).本实验选择最终的产品G(XMEAS(35)作为质量变量y(l=1).

通过正常数据建立动态模型,分别采用TPLS和DT-PCR对输出进行预测.如图 7所示,DT-PCR预测值精度高于TPLS预测精度.对于TEP输出的预测,DT-PCR预测性能比TPLS更精确.

图 7 DT-PCR与TPLS的预测结果 Figure 7 The predicted results of DT-PCR and TPLS

在故障检测实验中,首先通过500个样本在正常工作状态下建立回归模型,再设置500个样本进行检测.其中200个样本不设置故障,而在剩下的300个样本中设置故障.在仿真实验中,一共设计了21个故障,其中15个是已知故障.这15个已知故障中,9个故障IDV(1,2,5,6,7,8,10,12,13)被划分成质量相关的故障,其它6个故障IDV(3,4,9,11,14,15)被划分成质量无关的故障[9].

TPLS的检测结果如图 8所示,TPLS的Tr2Qr两部分均发出警报,Ty2To2未发出警报,TPLS可以检测出该故障. DT-PCR的故障检测结果如图 9所示,当故障IDV(14)发生时,Tk2发出警报而Ty2没有发出警报,因此根据DT-PCR的故障诊断逻辑,判断故障IDV(14)是质量无关的故障,与已知条件相符.

图 8 在IDV(14)发生时TPLS的故障检测结果 Figure 8 Monitoring results of IDV(14) with TPLS
图 9 在IDV(14)发生时DT-PCR的故障检测结果 Figure 9 Monitoring results of IDV(14) with DT-PCR

通过这2个实验的实验结果证明,DT-PCR能够很好地应用于动态系统中.与TPLS相比,DT-PCR可以提供更准确的输出预测结果和更简便的故障诊断策略.

5 结论

本文提出一种基于ARMAX模型的DT-PCR方法,用于具有动态性能的故障检测.相比于TPLS方法,DT-PCR提供了更精确的输出预测结果和更简便的故障诊断略. DT-PCR利用ARMAX模型构成增广输入矩阵并提供动态输入数据.在故障检测方面,DT-PCR有效地将变量空间分成质量相关和质量无关两部分,并提供精确的故障检测结果.此外,在数值例子和TEP的实验过程中,DT-PCR表现出稳定的性能并能够很好地应用于质量相关的过程监控中.

参考文献
[1] 王兵, 许少华, 孟耀华. 基于半监督竞争学习过程神经网络的抽油机故障诊断[J]. 信息与控制, 2014, 43(2): 235–240.
Wang B, Xu S, Meng Y. Fault diagnosis of pumping unit based on semi-supervised competitive learning process neural network[J]. Information and Control, 2014, 43(2): 235–240.
[2] 文成林, 吕菲亚, 包哲静, 等. 基于数据驱动的微小故障诊断方法综述[J]. 自动化学报, 2016, 42(9): 1285–1299.
Wen C, Lü F, Bao Z. A review of data driven-based incipient fault diagnosis[J]. Acta Automatica Sinica, 2016, 42(9): 1285–1299.
[3] 李荣雨, 荣冈. 基于故障映射向量和结构化残差的主元分析(PCA)故障隔离[J]. 控制理论与应用, 2008, 25(6): 1099–1104.
LI R, RONG G. Principal component analysis (PCA) of fault isolation based on fault mapping vector and structured residual[J]. Control Theory & Applications, 2008, 25(6): 1099–1104.
[4] 薄翠梅, 王执铨, 张广明. 基于KPCA-PNN的复杂工业过程集成故障辨识方法[J]. 信息与控制, 2009, 38(1): 98–104.
Bo C, Wang Z, Zhang G. An integrated fault identification method based on KPCA-PNN for complex industrial process[J]. Information and Control, 2009, 38(1): 98–104.
[5] Yin S, Wang G, Yang X. Robust PLS approach for KPI-related prediction and diagnosis against outliers and missing data[J]. International Journal of Systems Science, 2014, 45(7): 1375–1382. DOI:10.1080/00207721.2014.886136
[6] 周悦, 岳林蓓, 张力心, 等. 基于粒子群变异的克隆选择算法的结构故障检测与分类[J]. 信息与控制, 2015, 44(4): 436–441.
Zhou Y, Yue L B, Zhang L X. Structural damage detection and classification based on clone selection algorithm of particle swarm mutation[J]. Information and Control, 2015, 44(4): 436–441.
[7] 罗明英, 侍洪波, 谭帅. 基于正交独立成分分析的过程数据建模[J]. 信息与控制, 2016, 45(5): 551–555.
Luo M, SHI H, TAN S. Process data modeling based on orthogonal independent component analysis[J]. Information and Control, 2016, 45(5): 551–555.
[8] 赵立杰, 王纲, 李元. 非线性主元分析故障检测和诊断方法及应用[J]. 信息与控制, 2001, 30(4): 359–364.
Zhao L, Wang G, Li Y. Study of a nonlinear PCA fault detection and diagnosis method[J]. Information and Control, 2001, 30(4): 359–364.
[9] Yin S, Zhu X, Kaynak O. Improved PLS focused on key performance-indicator-related fault diagnosis[J]. IEEE Transactions on Industrial Electronics, 2015, 62(3): 1651–1658. DOI:10.1109/TIE.2014.2345331
[10] Zhou D, Li G, Qin S J. Total projection to latent structures for process monitoring[J]. AIChE Journal, 2010, 56(1): 168–178.
[11] Yin S, Ding S X, Zhang P, et al. Study on modifications of PLS approach for process monitoring[J]. IFAC Proceedings Volumes, 2011, 44(1): 12389–12394. DOI:10.3182/20110828-6-IT-1002.02876
[12] Qin S J, Zheng Y. Quality relevant and process relevant fault monitoring with concurrent projection to latent structures[J]. AIChE Journal, 2013, 59(2): 496–504. DOI:10.1002/aic.v59.2
[13] 孙茂伟, 杨慧中. 局部加权混合核偏最小二乘算法及其在软测量中的应用[J]. 信息与控制, 2015, 44(4): 481-486. Sun M, Yang F, Bao Z. Local weighted mixed kernel partial least squares algorithm and its applications to soft-sensing[J]. Information and Control, 2015, 44(4):481-486. http://ic.sia.cn/CN/abstract/abstract12311.shtml
[14] 夏陆岳, 王海宁, 朱鹏飞, 等. KPCA-bagging集成神经网络软测量建模方法[J]. 信息与控制, 2015, 44(5): 519-524. Soft sensor modeling method using kernel principal component analysis ensamble neural network[J]. Information and Control, 2015, 44(5):519-524. http://ic.sia.cn/CN/abstract/abstract12317.shtml
[15] 刘爽, 吕永波, 张仲义. 基于AHP和PCA的多指标评价建模方法及应用[J]. 信息与控制, 2015, 44(4): 416–421.
Liu S, Lü Y, Zhang Z. Multi-index evaluation modeling method based on AHP and PCA and its application[J]. Information and Control, 2015, 44(4): 416–421.
[16] 周东华, 胡艳艳. 动态系统的故障诊断技术[J]. 自动化学报, 2009, 35(6): 748–758.
Zhou D H, Hu Y Y. Fault diagnosis techniques for dynamic systems[J]. Acta Automatica Sinica, 2009, 35(6): 748–758.
[17] Jia Q, Zhang Y. Quality-related fault detection approach based on dynamic kernel partial least squares[J]. Chemical Engineering Research and Design, 2016, 106: 242–252. DOI:10.1016/j.cherd.2015.12.015
[18] Dong Y, Qin S J. Dynamic-inner partial least squares for dynamic data modeling[J]. IFAC-PapersOnLine, 2015, 48(8): 117–122. DOI:10.1016/j.ifacol.2015.08.167
[19] Wang G, Yin S. Quality-related fault detection approach based on orthogonal signal correction and modified PLS[J]. IEEE Transactions on Industrial Informatics, 2015, 11(2): 398–405.
[20] Ku W, Storer R H, Georgakis C. Disturbance detection and isolation by dynamic principal component analysis[J]. Chemometrics and intelligent laboratory systems, 1995, 30(1): 179–196. DOI:10.1016/0169-7439(95)00076-3
http://dx.doi.org/10.13976/j.cnki.xk.2017.0671
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

王光, 孙程远, 尹珅
WANG Guang, SUN Chengyuan, YIN Shen
基于动态全主成分回归质量相关的故障检测
Quality-related Fault Detection Approach Based on Dynamic Total Principal Component Regression Component Regression
信息与控制, 2017, 46(6): 671-676.
Information and Control, 2017, 46(6): 671-676.
http://dx.doi.org/10.13976/j.cnki.xk.2017.0671

文章历史

收稿/录用/修回: 2016-11-09/2017-01-11/2017-02-20

工作空间