文章快速检索  
  高级检索
基于数据的风电机组发电机健康状况评估
张静1, 李柠1, 李少远1, 黄猛2     
1. 上海交通大学自动化系, 上海 200240;
2. 上海电气风电集团有限公司, 上海 201199
摘要: 发电机是风电机组中的关键部件,然而由于运行环境恶劣、内部结构复杂,发电机发生故障的概率较高且维修困难.针对此问题,提出了一种基于SCADA(supervisory control and data acquisition)数据的发电机健康状况的评估方法.首先结合专家经验并分析状态变量间的相关性,识别出与发电机运行状态具有较强关系的变量和冗余变量,在此基础上进行合理的特征选择.然后利用历史多维状态信息,采用发电机健康运行时的数据建立基于高斯混合模型(GMM)的健康基准模型.最后设计一种基于马氏距离的健康衰退指标(HDI)用于评判发电机的健康状况.利用上海电气某风场2016年的SCADA数据对本文方法进行验证,结果表明,该方法可以准确地跟踪发电机运行状态的变化过程,起到了很好的故障早期识别作用且具有普适性.
关键词: 发电机     相关性分析     高斯混合模型     在线健康评估     健康衰退指标    
Health Assessment of Wind-turbine Generator Based on Data
ZHANG Jing1, LI Ning1, LI Shaoyuan1, HUANG Meng2     
1. Department of Automation, Shanghai Jiao Tong University, Shanghai 200240, China;
2. Shanghai Electric Wind Power Group Co., Ltd, Shanghai 201199, China
Abstract: The generator is a crucial component of the wind turbine. However, the failure probability of the generator is high and maintenance is difficult due to its complicated internal structure and harsh operating environment. To solve this problem, we propose a health assessment method for the wind-turbine generator based on supervisory control and data acquisition (SCADA) data. First, we identify variables related to the operating status of the generator and redundant variables based on expert experience and correlation analysis of the state variables. On this basis, we select some reasonable state parameters. Then, using historical data from normal operation, we establish a health benchmark model based on the Gaussian mixture model (GMM). Finally, to evaluate the health status of a generator, we design a health degradation index (HDI) based on the Mahalanobis distance. We verify the effectiveness of our proposed method, and we apply it to 2016 SCADA data from a wind farm of the Shanghai Electric Wind Power Group Co., Ltd. The test results show that the proposed method can accurately track changes in the generator operating status and facilitate early fault identification. In addition, the proposed method is universal in its application.
Keywords: generator     correlation analysis     Gaussian mixture model (GMM)     online health assessment     health degradation index (HDI)    

0 引言

风电机组通常地处气候恶劣的海上、高山等地区,受到地理位置、天气、时间等多种因素的限制,其定期维护和故障检修的成本较高,约占整个风电行业生产总值的10%~15%[1-3].发电机是风电机组中的关键部件之一,由于其内部结构复杂,又受到机械、风力、环境温度等多种变化复杂的因素的影响,发电机在实际运行过程中发生故障的概率相对较高且维修耗费时间较长[4-5].然而,发电机的许多故障并不是突发性的偶然故障,在发生故障前往往经历了一系列的劣化变化过程.因此,对发电机的运行状况进行实时评估,判断其当前的健康情况,及时发现潜伏性故障[6],提醒现场工程师注意防范和提前制定相应的检修计划,对降低风电机组的突发性停运概率、提高风电机组的安全运行和整个风场的生产效率具有重要的意义[7-9].

对风电机组进行状态监测可以通过对相关的振动信号进行分析[10-11],但额外安装振动传感器等往往会进一步增加机组运维的成本.针对此问题,Jin等提出了一种同步重采样的方法,对非平稳电流信号的故障特征进行提取和重建,通过计算关联维数实现状态监测[12].然而,只采用单一维度信息,由于信息量的缺乏,不足以对发电机的运行状态进行全面的评价.目前,大多数风电场通过安装SCADA系统(风电数据采集与监视控制系统)来监测风电机组的运行状况,近年来利用SCADA系统中大量与风电机组运行状况密切相关的状态参数数据进行状态监测逐渐成为研究的热点[13-14].文[15]采用非线性状态估计(NEST)的方法,利用齿轮箱正常工作时的相关温度信息建立模型,采用滑动窗口的方法估计残差,并通过与设置的残差报警阈值进行比较来进行状态评估. Hu等提出了一种基于劣化度函数的发电机劣化状况的识别方法[16].文[17]提出了一种基于非线性自回归神经网络(NARX)的健康评估模型,利用模型的估计值与监测值间的马氏距离构建健康评价指标. Andrew等提出了一种基于人工神经网络(ANN)的发电机轴承温度的故障预测算法[18].然而,上述方法在选取状态变量时,往往只依赖人工经验,未充分考虑状态参数间的相关性,对大量状态参数未进行有效的特征选择,导致人为干扰较大且引入与监测对象不相关、冗余或无用的变量,对健康评估的结果造成影响.

针对以上风机健康评估所存在的一些不足,本文提出了一种基于SCADA数据的发电机健康状况的评估方法.该方法主要包括特征选择、健康基准模型和在线健康评估三个部分.首先,针对特征选择问题,结合相关专家经验,并充分考虑状态参数间的相关性,利用Pearson相关系数和最大信息系数(maximal information coefficient,MIC)两种方法来度量变量间的相关程度,依此进行特征选择以得到合理的状态特征向量.其次,充分利用相关的多维状态信息,采用SCADA系统中发电机正常运行时的历史数据建立基于高斯混合模型(GMM)的健康基准模型,并将该模型作为健康评估时识别发电机劣化过程或故障的背景模型.最后,设计了一种基于马氏距离的健康衰退指标HDI(health degradation index)用于评价发电机的健康程度.图 1给出了本文所提出的基于SCADA数据的发电机健康状况评估的整体思路框架.

图 1 发电机健康评估思路框架 Figure 1 The health assessment framework of the generator
1 特征选择

对发电机进行健康评估,首先需要从SCADA系统中选取与发电机运行状态相关且影响较大的状态参数,构建状态特征向量.结合专家经验,并选择可靠的相关性分析方法,合理利用数据的特性,分析状态参数间的相关性,可以有效地识别出与发电机运行状态相关的状态参数以及作用相似的冗余变量,进而可以对状态参数进行有效的特征选择,降低模型的规模和计算复杂度,避免不相关状态参数对评估结果的影响,最终提高对发电机运行状态的评估效果.

Pearson相关系数是被称为“统计学之父”的Karl Pearson提出的[19],也是目前较为常用的一种相关性分析方法. Pearson相关系数能够反映变量之间线性相关关系的密切程度.对于两个变量XY之间的Pearson相关系数的定义为

(1)

其中,cov(XY)表示变量的协方差,σxσy为变量的标准差.

当变量XY的样本量为n时,则Pearson相关系数引申为

(2)

其中,r代表了两个随机变量之间线性相关程度的指标,范围在[-1, 1]之间.当r为正时,表示两个变量为正相关;当r为负时,表示两个变量为负相关. r的绝对值越接近或者等于1,表示两个变量的线性相关性越强;r的绝对值越接近或者等于0,表示两个变量的线性相关性很弱或者不是线性关系.

然而,实际中由于风机运行工况复杂,数据噪声较大,状态变量之间往往并非简单的线性关系,还存在着许多非线性的相关性且无法用具体的公式表达.因此,本文采用MIC对变量之间的相关性做进一步探究.

MIC是Reshef等在2011年发表在《Science》上的文章中提出的,它能够快速通过给不同类型的关联进行评估,从而发现广泛范围的关联类型[20].

MIC是在互信息理论的基础上发展起来的,其基本思想为:当两个变量XY之间存在相关性时,通过在其散点图中绘制网格可以把散点图中的点进行分割,则有的网格中含有散点而有的为空.进一步增大网格的分辨率并计算出每种分辨率下所能达到的最大互信息值.最后,对所有的最大互信息值标准化处理.定义矩阵:

(3)

其中mxy为每种分辨率下的标准化最大互信息值,则:

(4)

当变量的样本量足够时,MIC相关性能够捕捉到变量间各种各样的关联性,而不局限于特定的函数类型. MIC的范围在[0, 1]之间,MIC的值越大表示两个变量的相关性越强.即当变量XY之间相互独立时,则MIC(XY)=0;变量XY之间具有确定关系时,则MIC(XY)=1.

2 健康状态评估 2.1 数据清洗和处理

为了识别发电机的劣化状态,本文借鉴图像处理中常用的“背景减除”[21]的目标检测思想,首先识别出发电机正常运行时的状态,即利用发电机正常运行时的状态数据构建健康基准模型,并将其作为识别发电机劣化或者故障的背景,在此基础上感知发电机劣化时导致监测数据分布的变化情况.然而,实际的SCADA系统中,由于传感器异常、信息处理错误、风机发生劣化或故障、人工检修等问题,导致数据存在缺失、异常等问题.因此,本文首先通过以下方法对原始数据进行清洗:

1) 剔除数据集中存在状态变量为“无数据”的记录或所有状态变量为“0”的记录;

2) 剔除数据集中所有有功功率小于等于0的记录;

3) 剔除数据集中存在状态变量超过报警阈值的记录;

4) 依据风机的故障记录,剔除机组故障停机前后一个小时,维护或手动启停机期间的记录.

然后,对样本数据进行归一化处理:

(5)

其中,xi是一个特征参数,μσ分别是特征xi的均值和标准差.

2.2 健康基准模型

高斯混合模型(GMM)[22]是一种无监督学习方式的数据聚类算法,它采用K个高斯概率密度来描述参数空间中数据的空间分布特性.它将每一个状态的数据用一个高斯分布来近似,通过增加高斯模型成员的数目可以以任意精度逼近任何的连续分布,并且抗干扰和去噪能力较为突出.考虑到实际风电状态数据多且噪声大,在不同运行环境下,数据的空间分布模式不一致,为了更快地识别这些模式并与发电机发生异常时数据的空间分布进行比较,本文利用高斯混合模型来构建健康基准模型.

高斯混合模型的定义为:设j时刻的观测值x,它的概率等于该观测值分别属于K个高斯分布的概率的加权和,表示为

(6)
(7)

其中,ωk是混合模型的权重系数且xL维的观测值列向量,x=[x1x2,…,xL]TΘ表示全部参数的集合,Θ={ωkμkCk};Nk(x|μkCk)是均值为μk、协方差矩阵为Ck的第k个多维高斯概率密度函数.

高斯混合模型的参数估计通常采用经典的最大期望(maximum expectation)优化算法[22].假设模型的训练样本为X={x1x2,…,xN},样本数量为N,则训练样本的对数似然函数L(X|Θ):

(8)

通过参数估计求解最优的参数Θ={ωkμkCk}使得L(X|Θ)的值达到最大.具体的参数估计步骤为:

1) 初始值.模型中每个分布的初始协方差矩阵为单位矩阵,初始均值为第1个观测值向量,各个分布的初始权重为ωk=1/K.

2) 估计步骤(E-step).对于新的观测值xj,它属于第k个高斯分布的概率:

(9)

其中,ϕ代表包含参数ωkμkCk的旧参数值.

3) 最大化步骤(M-step).依据新的观测值更新模型权重参数、均值和协方差矩阵:

(10)
(11)
(12)

其中,ωk*μk*Ck*为更新后的参数值.

4) 收敛性判定.不断迭代步骤2)和步骤3),重复对参数进行更新,直到满足|L(X|Θ)-L(X|Θ*)| < ε,通常ε≤10-5L(X|Θ*)表示参数更新后的样本对数似然值.

2.3 在线健康评估

发电机发生劣化或故障时类似于发电机在健康背景上的新事物,劣化程度的多少可以用劣化时发电机的状态特征向量与健康基准模型的距离来评判,距离越大,表明发电机当前的运行状态与健康运行状态差距越大,发电机的运行状况越差.因此,为了识别发电机劣化或故障时的状态,需要衡量发电机异常时状态特征向量与健康运行状态空间分布的偏离度.

马氏距离(Mahalanobis distance)[23]是由印度学家Mahalanobis提出的,它用来度量空间中一个点x与一个分布P之间的距离,是基于样本分布的距离描述.与欧氏距离不同,它能够考虑各种特征之间的联系.定义为

(13)

其中,x表示多维空间中的一个点,μ代表分布P中各个数据点的均值,C代表分布P中数据点之间的协方差矩阵.

假设发电机当前时刻的运行状态特征向量为x,则定义此时描述发电机健康状况的健康衰退指标HDI(health degradation index)为

(14)
(15)

HDI(t)越小,表明当前的运行状态越接近于健康时刻的运行状态. m表示滑动窗口,由于风机运行时工况是一直变化的,因此考虑历史指标对当前时刻健康衰退指标的影响,也可抑制随机因素对评估指标的影响. D(x)表示当前时刻状态向量x与健康基准模型间的马氏距离.

假设发电机的健康基准模型为

(16)

其中,K表示该GMM模型中包含K个高斯分布.式(15)中的D(x)为

(17)
(18)

其中,di(x)表示当前时刻状态向量x与第i个高斯分布的马氏距离.

3 实例分析 3.1 数据描述

为验证上述风电机组发电机健康评估模型的有效性,本文以上海电气某风场某台2 MW变桨变速风机作为研究对象,利用其半年的SCADA数据,数据采样间隔为30 s.依据专家经验,选取状态参数共23个,部分原始数据如表 1所示.本文主要通过发电机后轴承温度信息来评估发电机的健康情况,因此,在选择状态参数时主要选择对该参数影响较大的参数.依据上述相关性分析方法,计算各状态参数与发电机后轴承温度的相关性,结果如表 2所示.

表 1 2016年5月1日部分原始数据 Table 1 Part of the original data on May 1, 2016
状态参数 时间
6:00:00 6:01:00 6:02:00 6:03:00 6:04:00 6:05:00 6:06:00 6:07:00 6:08:00 6:09:00
30 s平均风速/(m/s) 3.32 3.46 3.2 3.41 3.01 3.13 3.33 3.39 3.24 3.05
舱外温度/℃ 18.79 8.6 8.7 8.8 8.8 13.9 14.2 14.3 14.4 27.8
风轮转速/(r/m) 8.54 8.51 8.53 8.49 8.45 8.5 8.5 8.51 8.47 8.43
发电机转速/(r/m) 1 006.8 1 008.3 1 007.6 1 005.3 1 000.1 1 006.1 1 006.4 1 007 1 005.4 999
有功功率/(kW) 72 80 78 66 43 74 71 76 66 39
低速轴承温度/℃ 58 55.1 54.5 54.1 53.6 58.2 57.7 57.5 57.3 54.2
高速轴承温度/℃ 52.3 48.8 48.5 48.3 48 53.4 53.4 53.5 53.5 51.1
齿轮箱油温/℃ 47.4 42.3 42.6 42.3 42.1 49.5 49.5 49.6 49.6 45.5
齿轮箱冷却水温度/℃ 42 36.7 42 41.1 39.8 22.2 22.1 22 21.9 35.3
发电机冷却水温度/℃ 35 38.2 39.59 35.3 38.3 36.7 38.9 39.8 37.4 39.8
发电机定子U温度/℃ 62.8 51 50.7 50.7 50.6 49.6 49.6 49.6 49.7 49.2
发电机箱变定子V温度/℃ 62.9 50.9 50.6 50.6 50.5 49.4 49.5 49.4 49.6 48.8
发电机定子W温度/℃ 62.9 50.8 50.5 50.5 50.4 49.3 49.3 49.4 49.6 48.9
自由端轴承温度/℃ 60.4 37.09 37.2 37.2 37.2 43.4 43.4 43.3 43.4 41.5
驱动端轴承温度/℃ 60 37.3 37.09 37.09 37.09 39 39 39 39 41.5
塔筒温度/℃ 27.3 12.5 12.5 12.2 12.5 15.7 15.7 15.7 15.8 34.59
塔底柜温度/℃ 29.8 20.5 18.29 17.29 19.29 19 19 19 18.9 36.9
机舱柜温度/℃ 33.7 24.2 24.2 24.2 24.2 25.9 26 26 26.1 33.4
变流器冷却水温度/℃ 30 26 27 27 27 32 31 30 29 34
桨距角/(°) 0 0 0 0 0 0 0 0 0 0
齿轮箱入口油温/℃ 47 42 43 42 42 50 50 50 50 46
齿轮箱润滑油温度/℃ 51.2 46.1 45.9 45.7 45.5 49.2 49.4 49.6 49.6 47.6
发电机滑环温度/℃ 32 21 22 22 22 24 24 24 24 31
表 2 相关性分析结果1 Table 2 Correlation analysis result 1
状态参数 Pearson相关系数 MIC
30 s平均风速/(m/s) 0.740 592 0.458 674
舱外温度/℃ -0.049 5 0.114 431
风轮转速/(r/m) 0.726 1 0.476 049
发电机转速/(r/m) 0.725 957 0.491 936
有功功率/kW 0.756 973 0.483 299
低速轴承温度/℃ 0.767 507 0.571 007
高速轴承温度/℃ 0.752 158 0.552 8
齿轮箱油温/℃ 0.654 718 0.480 752
齿轮箱冷却水温度/℃ 0.293 812 0.150 947
发电机冷却水温度/℃ -0.098 54 0.058 478
发电机定子U温度/℃ 0.874 917 0.702 876
发电机定子V温度/℃ 0.873 657 0.703 193
发电机定子W温度/℃ 0.875 846 0.705 545
自由端轴承温度/℃ 0.748 017 0.543 565
驱动端轴承(发电机后轴承)温度/℃ 1 1
塔筒温度/℃ 0.133 791 0.145 317
塔底柜温度/℃ 0.186 307 0.160 433
机舱柜温度/℃ 0.219 219 0.160 5
变流器冷却水温度/℃ -0.061 85 0.079 834
桨距角/(°) 0.502 099 0.241 027
齿轮箱入口油温/℃ 0.651 433 0.465 598
齿轮箱润滑油温度/℃ 0.824 589 0.684 588
发电机滑环温度/℃ 0.410 552 0.238 764

表 2的相关性计算结果可以看出,各状态参数与发电机后轴承温度的相关性差异较大.为避免不相关及弱相关的状态参数对评估效果的影响,结合Pearson和MIC两种方法的相关性结果,可以挑选出与发电机后轴承温度相关性较强的15个状态参数,如表 2阴影部分所示.

为防止引入冗余变量,精简模型的训练数据集,对上述15个状态参数间的相关性做进一步探究,部分参数间的相关性结果如表 3所示.

表 3 相关性分析结果2 Table 3 Correlation analysis result 2
Pearson相关系数 风轮转速/(r/m) 发电机定子W温度/℃ 齿轮箱油温/℃
发电机转速/(r/m) 0.999 968 0.759 768 0.501 917
发电机定子U温度/℃ 0.764 418 0.999 784 0.677 358
发电机定子V温度/℃ 0.766 649 0.999 708 0.679 600
齿轮箱入口油温/℃ 0.549 192 0.678 826 0.996 715

表 3的相关性计算结果可以看出,风轮转速和发电机转速、发电机定子W温度和发电机定子U(V)温度、齿轮箱油温和齿轮箱入口油温的Pearson相关系数基本为1,它们在反映发电机运行状态时的作用基本相同.如果同时考虑这些参数,将会引入冗余变量,增加模型的复杂度和计算量.因此,结合表 2表 3的相关性结果,在表 2中已选的15个状态参数(阴影部分)基础上,去除发电机转速、发电机定子U(V)温度和齿轮箱入口油温4个冗余状态参数,本文最终选取余下的11个状态参数建立状态特征向量.

利用上述11个状态参数的历史数据,经数据清洗和处理后,得到发电机正常运行时的状态数据集.进一步,利用高斯混合模型的方法构建健康基准模型.理论上,高斯混合模型中高斯分量越多,将越逼近原状态空间的分布,识别效果也更好.然而,高斯分量过多将会导致参数训练不充分,计算量增大,降低系统识别率[24].目前,高斯混合模型中高斯分量一般选取3~5个[25],考虑到风电数据的维度较高,数据的分布模式复杂,本文选取高斯分布的数目K=5.图 2中是利用高斯混合模型训练得到的健康基准模型的3维图.

图 2 健康基准模型的3维图 Figure 2 3D map of the health benchmark model

为确定健康衰退指标的报警阈值,本文另选择风机无故障运行时的3 854条采样数据计算每个采样点与健康基准模型之间的马氏距离.图 3图 4分别是马氏距离和健康衰退指标HDI的分布情况.可以看出,发电机正常运行时与健康基准模型的偏离范围基本稳定在30以下且HDI基本维持在4以下,因此本文将健康衰退指标的报警阈值设为4,即当HDI超过4时,表明发电机当前偏离健康基准模型,并且该值越高,意味着发电机当前运行状态偏离正常状态越严重,可能存在潜在的风险或故障.

图 3 马氏距离分布 Figure 3 The distribution of Mahalanobis distances
图 4 HDI分布 Figure 4 The distribution of HDI

为验证本文所提方法的有效性,本文通过以下具体的实例来说明.

3.2 实例分析 3.2.1 实例1

该机组于2016年10月19日18:30发电机后轴承温度报警且报警前风机一直处于运行状态.图 5是故障发生前后风速、有功功率及发电机后轴承温度等的变化曲线图,红色虚线为故障发生时刻.可以看出,在故障发生之前,风机的有功功率、发电机后轴承温度、风速等逐渐升高,但均未超过系统中所设定的报警阈值,直到18:30,发电机后轴承温度超过所设阈值90 ℃发出报警.

图 5 实例1相关变量变化图 Figure 5 The change of related variables in example 1

依据本文方法选取11个状态参数,得到故障发生前后的发电机健康衰退指标HDI的变化曲线,如图 6所示.可以看出,在4:00-12:13(黑色虚线),尽管风速逐渐增大,但HDI均能维持在4以下.之后随着风速继续增大,发电机后轴承温度逐渐升高,发电机的HDI发生异常,超过报警阈值4且有明显升高趋势,并在故障发生时刻(红色虚线)显著升高.由此可看出,本文所提健康衰退指标HDI可准确地跟踪发电机的运行状态.同时,健康衰退指标HDI在故障发生前6 h开始超过报警阈值,比现有SCADA报警系统更早地识别发电机运行性能劣化的过程,起到了提前识别故障、发现故障的作用.

图 6 相关性分析后得到的HDI Figure 6 The HDI obtained after the correlation analysis

未进行相关性分析直接利用专家经验选取的23个状态参数构建状态特征向量,所得到的健康衰退指标NC-HDI如图 7所示,其中黑色虚线表示超过报警阈值时刻13:14.通过对比图 6图 7可以发现:

图 7 无相关性分析得到的NC-HDI Figure 7 The NC-HDI obtained without correlation analysis

1) 当发电机的运行状态发生异常时,经相关性分析后得到的HDI变化更为明显,对发电机的运行状态反映更加灵敏;

2) 经相关性分析后得到的HDI能够在故障发生前更早的时间出现异常,比未经相关性分析得到的NC-HDI提前1 h超过报警阈值;

3) 经相关性分析后,去除了不相关以及弱相关的状态参数,能够排除异常点的干扰.

未进行去冗余利用表 2中的15个状态参数(阴影部分)构建状态特征向量,得到的健康衰退指标NR-HDI与本文中的HDI对比结果,如图 8所示.可以看出,本文中的HDI和未去冗余得到的NR-HDI对发电机的健康评估效果相差不大.因此,去除冗余变量后,选取的状态参数减少,不仅降低了模型的复杂度和计算量且对发电机的健康评估效果无影响.

图 8 NR-HDI和HDI的对比 Figure 8 The comparison of NR-HDI and HDI
3.2.2 实例2

为验证本文算法的普适性,本文选取另外一台风机的SCADA数据进行测试.该机组于2016年8月27日23:11发电机v1相绕组温度报警,图 9是故障发生前后风速、有功功率及发电机定子W温度等的变化曲线图,红色虚线为故障发生时刻.依据本文方法得到的HDI与未经相关性分析得到NC-HDI对比结果如图 10所示.

图 9 实例2相关变量变化 Figure 9 The change of related variables in example 2
图 10 HDI和NC-HDI的对比 Figure 10 The comparison of HDI and NC-HDI

图 10中红色虚线表示故障发生时刻,两条黑色虚线分别表示健康衰退指数HDI与无相关性分析得到的NC-HDI超过报警阈值时刻,依次为17:36和19:45.可以看出,经相关性分析后得到的HDI反映发电机的运行状态更加灵敏,并且相比NC-HDI提前两个多小时发生异常并超过阈值,起到提前报警的作用.因此,本文中考虑状态参数间相关性的健康评估方法要更优异.

4 结语

本文主要提出了一种基于SCADA数据的风电机组发电机健康状况的评估方法.首先针对状态参数的选取问题,本文在结合相关专家经验的基础上,充分考虑状态参数间的相关性,挑选出与发电机运行状态具有较强关系的状态参数并去除冗余变量,构建合理的状态特征向量;然后,充分利用相关的多维状态信息,依据发电机正常运行时的历史状态数据,利用高斯混合模型建立发电机健康评估的基准模型,并将其作为识别发电机劣化和故障的背景模型;最后在线健康状态评估时,本文基于马氏距离的方法设计了一种用于描述发电机运行状态的健康衰退指标HDI,并依据历史健康数据的HDI分布规律建立报警阈值.利用实际某风场的SCADA数据对本文方法进行验证,结果表明,本文提出的HDI可准确地跟踪发电机运行状况的变化,识别发电机机运行性能的劣化过程,并能够实现提早识别异常.与未经相关性分析相比,本文的HDI更加灵敏,能够在故障发生前更早的时间超过报警阈值.此外,通过去除冗余变量,降低了模型的复杂度和计算量.

风机的状态监测,不仅关注风电机组中关键部件健康状态的变化情况,整机的运行状态评估也尤为重要.然而,由于环境、负载等多种因素的影响,风机的运行工况复杂多变.因此,进一步的研究中主要考虑在变工况的条件下对风电机组整机进行有效的状态评估及故障预测.

参考文献
[1] Lu B, Li Y, Wu X, et al. A review of recent advances in wind turbine condition monitoring and fault diagnosis[C]//2009 Power Electronics and Machines in Wind Applications. Piscataway, NJ, USA: IEEE, 2009: 1-7.
[2] Watson S J, Xiang B J, Yang W, et al. Condition monitoring of the power output of wind turbine generators using wavelets[J]. IEEE Transactions on Energy Conversion, 2010, 25(3): 715–721. DOI:10.1109/TEC.2010.2040083
[3] Wang Y L, Wang X. Fault diagnosis of wind turbine's converter based on memristive neural network[J]. Applied Mechanics and Materials, 2014, 705: 333–337. DOI:10.4028/www.scientific.net/AMM.705
[4] Ibrahim R K, Watson S. Condition monitoring of permanent magnet synchronous generator for wind turbine applications[C]//2016 3rd Conference on Control and Fault-Tolerant Systems. Piscataway, NJ, USA: IEEE, 2016: 648-653.
[5] Daneshi-Far Z, Capolino G A, Henao H. Review of failures and condition monitoring in wind turbine generators[C]//2010 XIX International Conference on Electrical Machines. Piscataway, NJ, USA: IEEE, 2010: 1-6.
[6] 胡昌华, 施权, 司小胜, 等. 数据驱动的寿命预测和健康管理技术研究进展[J]. 信息与控制, 2017, 46(1): 72–82.
Hu C H, Shi Q, Si X S, et al. Data-driven life prediction and health management:State of the art[J]. Information and Control, 2017, 46(1): 72–82.
[7] Tchakoua P, Wamkeue R, Ouhrouche M, et al. Wind turbine condition monitoring:State-of-the-art review, new trends, and future challenges[J]. Energies, 2014, 7(4): 2595–2630. DOI:10.3390/en7042595
[8] Amirat Y, Benbouzid M E H, Al-Ahmar E, et al. A brief status on condition monitoring and fault diagnosis in wind energy conversion systems[J]. Renewable and Sustainable Energy Reviews, 2009, 13(9): 2629–2636. DOI:10.1016/j.rser.2009.06.031
[9] 周封, 吕金贵, 李隆, 等. 智能电机故障诊断分析及预警系统设计[J]. 信息与控制, 2017, 46(6): 738–745.
Zhou F, Lü J G, Li L, et al. Design of intelligent fault diagnosis and early warning system of motors[J]. Information and Control, 2017, 46(6): 738–745.
[10] Hameed Z, Hong Y S, Cho Y M, et al. Condition monitoring and fault detection of wind turbines and related algorithms:A review[J]. Renewable and Sustainable energy reviews, 2009, 13(1): 1–39.
[11] Márquez F P G, Tobias A M, Pérez J M P, et al. Condition monitoring of wind turbines:Techniques and methods[J]. Renewable Energy, 2012, 46: 169–178. DOI:10.1016/j.renene.2012.03.003
[12] Jin X, Qiao W, Peng Y, et al. Quantitative evaluation of wind turbine faults under variable operational conditions[J]. IEEE Transactions on Industry Applications, 2016, 52(3): 2061–2069. DOI:10.1109/TIA.2016.2519412
[13] Yang W, Court R, Jiang J. Wind turbine condition monitoring by the approach of SCADA data analysis[J]. Renewable Energy, 2013, 53: 365–376. DOI:10.1016/j.renene.2012.11.030
[14] Tautz-Weinert J, Watson S J. Using SCADA data for wind turbine condition monitoring-A review[J]. IET Renewable Power Generation, 2016, 11(4): 382–394.
[15] 刘长良, 闫萧. 基于工况辨识的风电机组齿轮箱状态监测[J]. 热能动力工程, 2016, 31(7): 41–46.
Liu C L, Yan X. Gearbox condition monitoring of wind turbine based on condition identification[J]. Thermal Power Engineering, 2016, 31(7): 41–46.
[16] Hu Y, Li H, Liao X, et al. A probability evaluation method of early deterioration condition for the critical components of wind turbine generator systems[J]. Mechanical Systems and Signal Processing, 2016, 76: 729–741.
[17] Bangalore P, Tjernberg L B. An artificial neural network approach for early fault detection of gearbox bearings[J]. IEEE Transactions on Smart Grid, 2015, 6(2): 980–987. DOI:10.1109/TSG.2014.2386305
[18] Andrew K, Anoop V. Analyzing bearing faults in wind turbines:A data-mining approach[J]. Renew Energy, 2012, 48: 110–116. DOI:10.1016/j.renene.2012.04.020
[19] 樊嵘, 孟大志, 徐大舜. 统计相关性分析方法研究进展[J]. 数学建模及其应用, 2014, 3(1): 1–13.
Fan R, Meng D Z, Xu D S. Research progress of statistical correlation analysis method[J]. Mathematical Modeling and Its Application, 2014, 3(1): 1–13. DOI:10.3969/j.issn.2095-3070.2014.01.002
[20] 王鹏, 张善从. 基于最大信息系数的时延数据相关性分析方法[J]. 电子测量技术, 2015(9): 112–115.
Wang P, Zhang S C. Delayed data dependency analysis method based on maximum information coefficient[J]. Electronic Measurement Technology, 2015(9): 112–115. DOI:10.3969/j.issn.1002-7300.2015.09.026
[21] Zivkovic Z. Improved adaptive Gaussian mixture model for background subtraction[C]//the 17th International Conference on Pattern Recognition. Piscataway, NJ, USA: IEEE, 2004: 28-31.
[22] 陈英.高斯混合模型聚类及其优化算法研究[D].南昌: 华东交通大学, 2015.
Chen Y. Gaussian mixture model clustering and optimization algorithm[D]. Nanchang: East China Jiaotong University, 2015. http://cdmd.cnki.com.cn/Article/CDMD-10404-1015037973.htm
[23] Xiang S, Nie F, Zhang C. Learning a Mahalanobis distance metric for data clustering and classification[J]. Pattern Recognition, 2008, 41(12): 3600–3612. DOI:10.1016/j.patcog.2008.05.018
[24] 吾守尔, 斯拉木. 基于隐马尔可夫模型的维吾尔语连续语音识别系统[J]. 计算机应用, 2009, 29(7): 2009–2011, 2025.
Nasirjan T, Wushour S. Uyghur continuous speech recognition system based on HMM[J]. Journal of Computer Applications, 2009, 29(7): 2009–2011, 2025.
[25] Stauffer C, Grimson W E L. Adaptive background mixture models for real-time tracking[C]//IEEE Computer Society Conference on Computer Vision and Pattern Recognition. Piscataway, NJ, USA: IEEE, 1999: 246-252.
http://dx.doi.org/10.13976/j.cnki.xk.2018.7488
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

张静, 李柠, 李少远, 黄猛
ZHANG Jing, LI Ning, LI Shaoyuan, HUANG Meng
基于数据的风电机组发电机健康状况评估
Health Assessment of Wind-turbine Generator Based on Data
信息与控制, 2018, 47(6): 694-701, 712.
Information and Control, 2018, 47(6): 694-701, 712.
http://dx.doi.org/10.13976/j.cnki.xk.2018.7488

文章历史

收稿/录用/修回: 2017-09-19/2018-03-01/2018-04-10

工作空间