文章快速检索  
  高级检索
基于改进KPCA与混合核函数LSSVR的泥石流预测
李丽敏1, 程少康1, 温宗周1, 萧明伟2, 徐根祺1, 张顺锋1     
1. 西安工程大学电子信息学院, 陕西 西安 710600;
2. 昆明理工大学国土工程资源学院, 云南 昆明 650504
摘要: 针对引发泥石流灾害的多重影响因素而导致的预测维数灾难,以及最小二乘支持向量回归(least squares support vector regression,LSSVR)模型中选取单核函数而导致的模型训练性能部分缺陷的问题,提出了一种基于改进的核主成分分析(kernel principal component analysis,KPCA)与混合核函数LSSVR的泥石流灾害预测方法.首先,将影响泥石流发生的7种初始因子赋予权重,利用加权KPCA法筛选出3个主成分影响因子作为模型输入;然后,将局部核函数与全局核函数相结合,运用到LSSVR模型上,进行泥石流发生概率预测,以平衡样本学习能力与泛化能力,并使用果蝇优化算法(fruit fly optimization algorithm,FOA)更新模型的最优参数;最后,以磨子沟监测数据进行仿真验证.结果表明,该方法能够有效地降低维数灾难并提升预测模型精确度,在误差允许范围内预测出泥石流发生概率值及对应的预警等级,为相关决策部门提供一定的借鉴经验.
关键词: 泥石流     最小二乘支持向量回归     混合核函数     加权核主成分分析     概率预测    
A Debris Flow Prediction Model Based on the Improved KPCA and Mixed Kernel Function LSSVR
LI Limin1, CHENG Shaokang1, WEN Zongzhou1, XIAO Mingwei2, XU Genqi1, ZHANG Shunfeng1     
1. School of Electronics and Information, Xi'an Polytechnic University, Xi'an 710600, China;
2. School of Land Engineering and Resources, Kunming University of Science and Technology, Kunming 650504, China
Abstract: In this study, we propose a debris flow prediction method based on the improved kernel principal component analysis (KPCA) and mixed kernel function least-squares support vector regression (LSSVR) to address the curse of prediction dimensionality when considering the multiple factors that influence the debris flow disaster and to tackle the problem of partial defects of model training performance caused by the selection of a single kernel function in the LSSVR model. First, we weight seven initial factors affecting the debris flow and select three principal-component-influencing factors as model inputs using the weighted KPCA method. Second, we use the LSSVR model by combining the local kernel function with the global kernel function to predict the debris flow probability and for balancing the learning ability and generalization ability of the samples. Third, we use the fruit fly optimization algorithm to obtain the optimal parameters of the model. Finally, we conducted a simulation experiment based on the monitoring data of a mill groove. The results denote that the proposed method can effectively reduce the curse of dimensionality and improve the accuracy of the prediction model. The probability value of debris flow within the allowable error and the corresponding warning level are predicted, which can provide certain reference for the relevant decision-making departments.
Keywords: debris flow     least squares support vector regression     mixed kernel function     weighted kernel principal component analysis     probabilistic prediction    

0 引言

泥石流是山区常见的地质灾害之一,其分布地域广,发生频率高,成灾速度快,严重威胁着山区人民的生命财产安全与经济社会的可持续发展[1-4].近年来,我国逐步重视提升对地质灾害的防治能力,力求建立高效科学的地质灾害防治体系,为人民群众生命财产安全提供有力保障.泥石流灾害预测问题已成为自然灾害领域研究的一项前沿课题,能否提供有效的泥石流灾害预报方法成为防灾减灾的关键点.

该领域科研工作者针对泥石流成灾的特点进行了深入研究,并提出了多种泥石流灾害预测预报方法,其方式各存利弊.曹禄来等[5]运用模糊系统理论与人工神经网络模型相结合的方法来评价泥石流发生危险的等级,将模糊逻辑推理知识作为危险性评价系统,以人工神经网络作为训练模型来降低数据处理复杂度与主观影响,但在训练过程中,模型本身易陷入局部极值而影响精确度;刘双等[6]依据当地泥石流的启动机理,分别运用沟床起动型泥石流10 min降雨预报公式与浅层滑坡汇集型沟谷泥石流的预报公式进行泥石流预警,在判定泥石流降雨临界值预报中具有较好效果,然而未深入考虑其它高相关影响因素,在一定程度上可能会产生漏报情况;丁桂伶等[7]在研究泥石流形成条件与其发育特征的基础上,安装多种类型的自动化设备对研究区进行实时动态监测,并提出了多参数联动预报模型的建议;李璐等[8]将多传感器信息融合理论运用于地质灾害预报模型中,利用多重影响因素综合预测危险度,较好地解决了以往因单一监测手段造成的漏报问题,但并未分析多个致灾影响因素之间的相关性,可能导致因素之间信息相互叠加,易发生维数灾难;董佳祺[9]、王常明[10]等利用支持向量机模型评价泥石流危险度,将多个影响因素作为模型输入,这一方法的优点在于其具有较好的普适性,虽然模型中选取的单核局部核函数学习能力较强,但泛化能力较弱,在实现模型训练最优组合上还存在一定上升空间.

针对以上预测方法的不足之处,本文提出了一种基于改进KPCA与混合核函数LSSVR的泥石流灾害预测方法.本研究运用改进型加权KPCA算法筛选出泥石流灾害主成分影响因子来取代高维初始影响因子,解决了预测维数灾难问题;另外,本文构造LSSVR泥石流预测模型并将全局核函数与局部核函数相结合,以平衡样本训练的学习能力与泛化能力,解决了模型中选取单核函数因部分性能缺陷而导致的预测精度下降问题.通过实验验证,结果表明,本文提出的方法在泥石流灾害概率预测中具有良好预测能力,为泥石流灾害预报与治理提供了一个新思路.

1 改进的KPCA

KPCA是一种数据降维与特征提取的方法,它的基本思想是利用核函数,将初始数据的非线性相关转换为线性相关,在映射后的核函数空间中进行主成分分析[11-13].

但传统KPCA与传统PCA一样,它们均假设每个样本数据为独立且平等的(每个数据点对协方差矩阵的贡献为1/n),但在实际工程应用中,每种特征可能存在不同的影响比重.因此,为了既能保证数据在实际应用中具有较高合理性,又能有效进行数据降维与特征提取,本文将传统的KPCA加以改进,通过在协方差矩阵中引入权值思想来影响原始数据中的样本或特征在模型内的权重来得到改进的KPCA.

设训练样本集为X={x1x2,…,xn},其中xi∈RPyi=Rp(Rp为输入空间,P为维数,i=1,…,n),输入空间非线性映射φ:XFF表示特征空间.

将权重思想引入协方差矩阵C中:

(1)

其中,C为协方差矩阵,n为训练样本数,φ(·)为输入空间非线性映射量,hi为特征权重,令满足权重的标准化范围.

对协方差矩阵C进行特征分解:

(2)

其中,λ≥0,特征向量如式(3)所示.

(3)

其中,r=1,…,n.

由于特征向量v是由非线性映射空间组成的,因此式(2)与式(4)等价.

(4)

将式(1)和式(3)代入式(4)中,令K=(Kij)n×n=(wiφ(xiwiφ(xj)),其中K为核矩阵,可得:

(5)

其中,核矩阵的特征向量为α1α2,…,αn,特征值为nλi.

选取前m(m < n)个特征值对应的归一化特征向量α1α2,…,αm,其中αr=(αr1αr2,…,αrm)(r=1,2,…,m),对φ(xj)在νr投影如式(6)所示.

(6)

其中,j=1,2…,nr=1,2,…,mgr(xj)为对应于φ(x)的第r个非线性主元分量.

将所有投影值g(xj)=(g1(xj),g2(xj)…,gm(xj))作为样本特征值,利用核函数代替空间点积计算,则式(6)可转换为

(7)

由特征值计算出个体贡献率的表达式为

(8)

累计贡献率的表达式为

(9)

式中,b为选取的主成分影响因子,m为初始影响因子.

根据计算出的特征值计算主成分影响因子,定义累计贡献率≥85%为筛选出的b(b < m)个主成分因子.

2 混合核函数LSSVR模型

LSSVR模型是在SVR(support vector regression)理论方法基础之上的扩展[14-15].它遵循结构风险最小化的原理,将二次规划问题转换为求解线性方程组问题以简化模型运算,在继承传统SVR的解决小样本、局部极值、过拟合等优点的同时,还降低了计算量,隶属机器学习中一种较为新型的运算方法.

定义回归函数为

(10)

其中,wb均为结构风险化最小化模型参数,w为权向量,b∈R代表偏差量,ϕ(x)为非线性映射函数.

确定决策参数wb后,求解问题为

(11)

其中,ξi∈R为误差变量,γ为可调超参数,l为样本总数.

定义拉格朗日函数:

(12)

其中,ak∈R为拉格朗日乘子.

对式(12)中的各变量求偏导并整理为线性方程组,得到:

(13)

其中,Il=[1,1,…,1];Ωij=K(xixj)=ϕT(xi)ϕ(xj),K(xixj)为核函数;α=[α1α2,…,αl],ij=1,2,…,l.

最终得出最小二乘支持向量回归的函数估计:

(14)

其中,不为0的元素αi所对应的样本(xiyi)为支持向量.

LSSVR模型建立的关键在于对核函数的选取.核函数的作用是将低维非线性变换为高维线性数据,是决定模型精确度的一个重要环节[16-17].因此,在相应的条件下选择适当的核函数能够很大程度地影响系统精度值.核函数一般可分为全局核函数与局部核函数,不同类型的核函数存在不同优点.

多项式(Poly)核函数被视为具有全局特性的核函数,图 1为Poly核函数曲线,其中,选取x=0.3为测试点,核函数系数q分别为1,2,3,4,5.

图 1 Poly核函数曲线 Fig.1 The polynomial kernel curve

图 1可看出,当输入样本数值远离测试点x时,对核函数值的影响会增加;当输入样本数值靠近测试点x时,对核函数值的影响会随之减少.因此,Poly核函数泛化能力较强,但学习能力较弱.

径向基(RBF)核函数被归为具有局部特性的核函数,图 2为RBF核函数曲线,同样取x=0.3为测试点,核函数系数σ分别为0.1,0.2,0.3,0.4,0.5.

图 2 RBF核函数曲线 Fig.2 The RBF kernel curve

图 2可得,当输入样本数值远离测试点x时,对核函数值的影响会降低;当输入样本数值靠近测试点x时,对核函数值的影响会随之增加.因此,RBF核函数符合局部核函数的特性,即学习能力较强,但泛化能力较弱.

因此,可将全局核函数与局部核函数相结合实现两者优势互补的效果,其组合表达式如式(15)所示.

(15)

其中,Kmix为混合核函数,KGlobal为全局核函数,KLocal为局部核函数;u∈[0, 1]为组合权重系数值,当u→1时,全局核函数产生较大影响作用;当u→0时,局部核函数产生较大影响作用.构造混合核函数的过程如图 3所示.

图 3 混合核函数构造流程图 Fig.3 Flow chart of the mixed kernel function construction

本文拟选择的全局核函数为多项式(Poly)核函数,局部核函数为径向基(RBF)核函数.因此,本文构造的混合核函数如式(16)所示:

(16)

其中,Kpoly为多项式核函数,KRBF为径向基核函数.

为了验证所构造出的混合核函数具有集成全局与局部核函数优势的效果,构造的混合核函数的曲线,如图 4所示.测试点依然选取x=0.3,设置q=2,σ=0.1为定值,核函数权重系数u分别取0.1,0.2,0.3,0.4,0.5.

图 4 混合核函数曲线 Fig.4 The mixed kernel curve

图 4可知,以x=0.3测试点为例时,距离测试点无论是靠近还是远离对核函数的值均具有较大的影响作用,兼顾了全局核函数的泛化能力与局部核函数的学习能力的优点.

3 基于果蝇算法的参数优化

由于混合核函数LSSVR模型中需要优化4个参数:可调超参数γ、RBF核参数σ、多项式阶数q、组合权重系数u,因此,研究中需要采用相应的优化算法对其进行参数寻优.

FOA优化算法是基于群体仿生的一种智能优化算法,其根本思想来源于果蝇群体的觅食行为,基本原理如文[18]所示.它的特点在于继承了智能仿生算法的群体合作与信息同享的优势.除此之外,其搜索机制还包含了更为简洁的嗅觉与视觉功能[19].嗅觉机制可防止寻参陷入局部最优解,视觉机制可使果蝇更快定位于较优位置.结合以上优点,本文利用FOA对混合核函数LSSVR模型进行全局性参数优化,其流程如图 5所示.

图 5 FOA优化混合核LSSVR参数流程 Fig.5 The mixed kernel LSSVR parameter′s optimization by FOA process

FOA优化混合核函数LSSVR的参数步骤为:

1) 初始化果蝇算法参数:种群规模S、最大迭代次数Tmax及果蝇初始位置(X0Y0).

2) 将每只果蝇个体赋予随机飞行搜索半径R′和搜索方向η,使其进行食物搜索:

(17)
(18)

其中,η∈[0, 1],R∈[0.5,1.5].

3) 计算每个果蝇个体的坐标位置与原点坐标之间的距离Di,令Di的倒数作为味道浓度判定值Si

(19)
(20)

由于本研究共需要优化4个参数:可调超参数γ、RBF核参数σ、多项式阶数q、组合权重系数u,因此设定味道浓度判定值分别为Si1Si2Si3Si4.

4) 定义味道浓度判定函数为Ffitness,即适应度函数,将式(20)中得出的味道浓度判定值Si代入Ffitness来计算每只果蝇的味道浓度.

本文采用均方根误差(RMSE)作为适用度函数Ffitness来度量样本实际值与预测值之间的偏差情况:

(21)

其中,Sm,i代表果蝇个体位置的味道浓度,yactual为第i个样本的实际值,yforecast为第i个样本的预测值,n为样本个数.

5) 保留由式(21)中求出果蝇最佳个体,即群体中浓度最低的果蝇:

(22)

其中,Ibest为最佳位置坐标,min(Sm,i)为味道浓度最低值.

6) 进入迭代寻优,判断新进化的果蝇最优浓度值是否低于前一代,若是,则执行下一步骤;反之,返回步骤2中开始运算,直至寻求最优为止.

7) 记录最佳优化参数γσqu,完成参数寻优,将最优参数保存.

4 仿真验证与结果分析 4.1 泥石流研究区概况

磨子沟地处于陕西省安康市紫阳县城关镇太平村,沟长约3 km,沟口高程约310 m.沟谷两侧山体多为较陡形,坡度范围约在25°至45°之间.其区域全年降雨主要集中于6月~9月之间,年平均降雨量约为1 000 mm,日平均降雨量最大值约为180 mm,为泥石流的发生提供了主要动力条件.磨子沟于2010年7月因发生特大暴雨而引发泥石流灾害,山体多处发生滑坡,由于其沟口地处岚紫公路、襄渝铁路桥梁、包茂高速公路交叉处,且平缓地带有少量民居[20],因此,此地区因易受地质灾害影响而存在一定安全隐患.

本研究依托“自然灾害智能监测预警系统”项目科研平台,运用在磨子沟部分山体区域已布设的雨量监测、次声监测、泥位监测、土壤墒情监测、倾角监测、孔隙水压力监测等相关传感器网络手段,并通过前期实地调研来观测其环境变化情况.

4.2 泥石流预测流程

以前期预实验从陕西磨子沟监测点所获取的全周期传感器监测数据为基础,并参考同类型泥石流影响参数数据与相关环境因子,以验证监测数据的有效性.最终,本文拟选取月降雨量、次声、泥位、土壤含水率、孔隙水压力、坡度、相对高差七个参数作为初始评定影响因子,以泥石流的发生概率作为预测对象,建立泥石流发生概率与影响因子之间的预测模型.本文的技术路线如图 6所示.

图 6 技术路线图 Fig.6 The technology roadmap

泥石流灾害预测的具体步骤为:

1) 收集研究区泥石流7种初始影响因子的原始数据共90个样本(如表 1所示),类型分别为月降雨量A1(mm)、次声A2(Hz)、泥位电信号A3(mA)、土壤含水率A4(%)、孔隙水压力A5(kPa)、坡度A6(°)、相对高差A7(m).对所有数据进行归一化处理,归一化范围为[0, 1].

表 1 初始影响因子数据 Tab.1 The initial impact factor
编号 类别
A1 A2 A3 A4 A5 A6 A7
1 20.4 0.5 7.5 0.05 -0.7 26.4 382
2 25.9 2.4 8.2 0.11 -0.33 35.1 512
3 40.2 3.1 11.7 0.21 0.32 27.4 490
4 80.4 4.1 13.9 0.2 0.56 39.1 580
85 80.9 5.3 12.4 0.19 0.54 32.8 487
86 100.8 3.8 7.8 0.22 0.49 27.4 397
87 120.3 4.9 14.4 0.24 0.66 36.6 573
88 154.5 5.6 12.2 0.3 0.64 32.8 461
89 167.9 6.8 15.5 0.34 0.8 35.6 520
90 172.3 7.4 15.8 0.35 0.82 36.8 423

2) 将经归一化处理后的初始影响因子赋予权重,运用改进的KPCA法进行特征提取与数据降维,其应用依据在于它能够剔除信息相互重叠的影响因子,在降低数据维数的同时能够保证实际工程应用的科学合理性.选取RBF核函数为改进KPCA的核函数,定义主成分方差累计贡献率达到85%及以上时,为筛选出的几种主成分影响因子.

3) 利用筛选出的主成分影响因子取代原有的初始影响因子,并根据主成分表达式计算出新样本数据,按训练集与测试集的比例为6:1来进行分配,将其作为混合核函数LSSVR泥石流预测模型的输入部分.设置FOA优化混合核函数LSSVR的各参数范围,将训练样本输入进混合核函数LSSVR模型进行训练.

4) 将测试集样本输入已构造的最优参数模型中,预测出泥石流可能发生概率,然后根据发生概率对应出泥石流预警等级.

5) 输出数据误差分析,并与单核LSSVR模型和BP神经网络模型进行预测精度对比,验证本研究模型精确度与可靠性.

4.3 改进的KPCA数据降维

本文利用从磨子沟监测点所采集到的7种影响因子数据作为样本输入部分,分别为月降雨量A1(mm)、次声A2(Hz)、泥位电信号A3(mA)、土壤含水率A4(%)、孔隙水压力A5(kPa)、坡度A6(°)、相对高差A7(m).由于在实际工程应用中,各类影响因子占据权重分布不均,为了保证数据运用的科学性与合理性,将经归一化处理后的90组数据结合相关专家经验与当地研究区的环境情况进行因子加权处理.其中,设定总权重为1,权重值分配分别为:A1为0.3,A3A6为0.15,其余权值各占0.1.然后,运用改进型KPCA进行主成分影响因子数据降维,其提取后的变量(图 7)与改进核主成分矩阵如表 2所示.

图 7 改进的KPCA提取变量 Fig.7 The improved KPCA extraction variables
表 2 核主成分矩阵 Tab.2 Kernel principal component matrix
影响因子 成分
1 2 3
A1 0.075 0.527 -0.102
A2 0.096 0.534 -0.098
A3 -0.157 -0.061 0.559
A4 -0.217 -0.115 0.625
A5 0.422 0.120 -0.074
A6 0.354 0.026 0.003
A7 0.510 0.018 -0.280

图 7可知,前3个成分的累计贡献率分别为46.478%、77.126%、88.299%,根据核主成分的定义选取标准,前3个主成分的累计贡献率已大于所定义主成分选取标准85%,能够较为全面地反映初始7种影响因子所反映的信息.因此,本文将前3个主成分作为新的变量取代初始影响因子以作为混合核函数LSSVR泥石流预测模型的输入.通过改进的KPCA来降维,模型维度由初始的7维降至3维,既降低了模型数据结构的复杂度,又保证了数据在实际应用中的相对合理性.

根据表 2中的核主成分矩阵可得,3个主成分的表达式为

(23)
(24)
(25)
4.4 FOA优化混合核函数LSSVR模型预测

将经改进KPCA法得到的90组重构主成分影响因子数据,按照训练集:测试集=6:1的比例进行分配,设置编号前1~75组数据为训练集,用于训练预测模型;76~90组数据为测试集,用于验证预测模型准确度.实验中采用混合核函数LSSVR作为泥石流概率预测模型,利用FOA对其进行最佳参数寻优.

在利用FOA对混合核函数LSSVR模型参数寻优时,需要对果蝇个体进行参数设置.针对本研究的预测模型中需要优化4个参数:可调超参数γ、RBF核参数σ、多项式阶数q、组合权重系数u,因此维度设置为4.同时,在采用小样本进行测试的情况下,为了保证寻优解收敛性较好且计算量不宜过大,将种群规模设置为S=20,最大迭代次数Tmax=200.

经FOA优化的混合核函数LSSVR最优适应度如图 8所示.由图 8可知,FOA优化算法在迭代前期能够快速收敛,易于寻求全局最优解,且约在迭代120次时收敛结束.得到的寻优参数结果分别为γ=7.84,σ=0.59,q=4.32.

图 8 FOA优化混合核函数LSSVR最优适应度图 Fig.8 FOA optimizes the optimal fitness picture of mixed kernel function model LSSVR

另外,混合核函数LSSVR的组合权重系数范围在[0, 1]之间,当以0.1为步长时,得到的组合权重系数瞬时精度如图 9所示.

图 9 组合权重系数精确度 Fig.9 The combined weight coefficient accuracy

图 9可知,当组合权重系数u为0.8时,瞬时精确度达到了91.3%.因此,组合权重系数为0.8时为最优系数.

同时,为了验证本文使用的FOA优化算法的时效性,本文在同等条件下(种群规模设置为S=20,最大迭代次数Tmax=200,维度为4)运用遗传算法(GA)和粒子群算法(PSO)分别对混合核函数LSSVR模型进行参数寻优,并与FOA优化算法进行对比,对比结果如表 3.

表 3 优化算法对比 Tab.3 Comparison of optimization algorithms
优化算法类别 寻优参数值 复杂度 寻优时间/s 迭代次数
FOA参数寻优 γ=7.84,σ=0.59,q=4.32,u=0.8 较简单 3.4 120
GA参数寻优 γ=6.14,σ=0.77,q=7.62,u=0.7 较复杂 10.1 187
PSO参数寻优 γ=18.33,σ=3.18,q=6.54,u=0.5 较简单 6.2 146

通过表 3中3种同类型优化算法对混合核函数LSSVR预测模型优化参数的对比分析可知,果蝇算法在优化过程中,复杂度较为简单,并且寻优时间短,迭代次数低,相比于GA和PSO优化算法,具有更高的时效性.

此外,为了验证本研究所采用的FOA优化混合核函数LSSVR模型的预测效果.本文将混合核函数LSSVR预测模型、两种类型的单核函数LSSVR模型以及BP神经网络模型等四种预测模型以同等条件进行实验分析,结果如图 10.

图 10 泥石流实际概率与4种预测结果对比 Fig.10 The comparison between the actual probability of the debris flow and the four prediction results

图 10的4种预测模型与泥石流实际发生概率值对比可得,本文提出的模型算法因其在LSSVR模型中选取混合核函数机制以平衡样本学习能力与泛化能力,在回归曲线分析上与其它3种模型相比较,本文提出的算法更接近真实值,具有更好的回归效果.

根据概率预测结果可对应出泥石流发生预警级别,提前知晓泥石流预警级别有助于人们采取有效措施降低灾害所造成的损失,泥石流灾害预警等级划分规则如表 4所示.

表 4 泥石流预警等级划分 Tab.4 The classification of the debris flow warning levels
预警级别 含义 色标 说明 发生概率Y /%
1 常规级 绿色 管理人员掌握 0~5
2 预测级 蓝色 科技与管理人员掌握 > 5~20
3 预报级 黄色 发布公众知晓情况 > 20~40
4 警报级 红色 组织公众应急响应 > 40

将4种概率预测模型结果按照泥石流预警等级划分后,与实际发生等级进行对比验证,验证结果如图 11图 12所示.

图 11 混合核LSSVR预测与实际等级对比 Fig.11 The comparison between the prediction and actual grade of the mixed kernel LSSVR
图 12 单核LSSVR和BP神经网络预测与实际等级对比 Fig.12 The comparison between the single kernel function LSSVR and BP neural network prediction and actual rating

图 11预测出的结果与实际预警等级对比可得,本文提出的混合核函数LSSVR模型预测精确度达到93.3%.在第1~8组与第10~15组测试样本中,本文提出的算法预测出的概率值所对应的等级均与实际概率所对应的预警等级相符合:例如,第5组测试样本中,预测概率值为11.4%,实际概率值为12.2%,则两者均对应第2级预警等级.另外,第9号测试样本预测出的结果与实际对应预警等级不符,分析其原因是因为第9号测试样本预测出的概率值为18.9%,而实际概率为20.5%,两者均较临近第2预警等级与第3预警等级的20%概率分界线,因此出现一定误差.相比于图 12中的单核LSSVR模型和BP神经网络预警等级划分得到86.7%的结果,本文提出的方法体现出较好的预测性能.

最后,将4种预测模型的预测误差利用均方误差(MSE)、和方差(SSE)进行误差程度综合评定,得到的结果如表 5所示.

表 5 模型误差综合评价结果 Tab.5 The results of model error comprehensive evaluation
综合评价指标 MSE SSE
评价指标描述 均方差误差范围[0,∞),最优值为0 和方差误差范围[0,∞),最优值为0
混合核LSSVR预测 0.025 1 0.376
单核RBF-LSSVR预测 0.044 9 0.674
单核Poly-LSSVR预测 0.065 9 0.989
BP神经网络预测 0.059 5 0.893

对比表 5得出的模型综合评价结果可知,本文提出的算法在MSE与SSE评价指标中,得到的均方根误差与和方差分别为0.025 1和0.376,相比其它3种模型更接近最优值且误差较小,具有相对可靠性.

5 结论

本文以泥石流灾害发生概率预测为研究对象,为了解决预测维数灾难与传统单核支持向量回归模型预测性能部分缺陷的问题,采用磨子沟研究区监测点预实验数据进行验证.

1) 由于考虑到研究区地质灾害受多重因素影响且各因素影响权重分布不均,本文提出加权KPCA法进行数据降维,将初始7种泥石流灾害影响因子降维至3维,在赋予各类初始影响因子合理权重的同时还能够有效进行数据降维,减少模型结构复杂度.

2) 首次将FOA优化混合核函数LSSVR模型应用于区域泥石流灾害概率预测中,选取混合核函数机制来平衡模型学习能力与泛化能力,以FOA优化最优参数模型进行预测.通过应用验证表明,本文提出的模型预测瞬时精度可达91.3%且泥石流预警等级划分精确度为93.3%,然后运用误差综合评价将混合核函数LSSVR对比单核函数LSSVR与BP神经网络模型可得,本文提出的研究方法更接近误差评价最优值.

3) 本研究工作主要针对地质灾害空间预测预警开展,而如何预报出灾害发生时间还需进一步探究,因此,若继续开展下一步工作,需寻求合适的时间预报模型与其相对应,从而能够有效预测泥石流灾害发生时间点.

参考文献
[1] 胡卸文, 刁仁辉, 梁敬轩, 等. 基于CFX的江口沟泥石流危险区范围预测模拟[J]. 岩土力学, 2016, 37(6): 1689–1695.
Hu X W, Diao R H, Liang J X, et al. Prediction and simulation of debris flow danger zone in Jiangkou gully based on CFX[J]. Rock and Soil Mechanics, 2016, 37(6): 1689–1695.
[2] Kang S, Lee S R. Debris flow susceptibility assessment based on an empirical approach in the central region of South Korea[J]. Geomorphology, 2018, 3(8): 1–12.
[3] 黄晓虎.泥石流降雨启动机制及早期预警模型的研究——以达摩沟为例[D].长春: 吉林大学, 2017: 4-14.
Huang X H. Study on debris flow rainfall initiation mechanism and early warning model-A case study of Damo Valley[D]. Changchun: Jilin University, 2017: 4-14.
[4] Kern A N, Addison P, Oommen T, et al. Machine learning based predictive modeling of debris flow probability following wildfire in the Intermountain Western United States[J]. Mathematical Geosciences, 2017, 49(4): 1–19.
[5] 曹禄来, 徐林荣, 陈舒阳, 等. 基于模糊神经网络的泥石流危险性评价[J]. 水文地质工程地质, 2014, 41(2): 143–147.
Cao L L, Xu L R, Chen S Y, et al. Debris flow risk assessment based on fuzzy neural network[J]. Hydrogeology and Engineering Geology, 2014, 41(2): 143–147.
[6] 刘双, 余斌, 马二龙, 等. 山西省平定县寨坪沟泥石流灾害特征及预警[J]. 泥沙研究, 2018, 43(6): 61–66.
Liu S, Yu B, Ma E L, et al. Characteristics and early warning of debris flow in Zhaiping gully, Pingding of Shanxi Province[J]. Journal of Sediment Research, 2018, 43(6): 61–66.
[7] 丁桂伶, 王翊虹, 姚康, 等. 泥石流多参数动态监测预警技术应用——以北京房山南窖泥石流为例[J]. 城市地质, 2017, 12(1): 111–116.
Ding G L, Wang Y H, Yao k, et al. Application of multi-parameter dynamic monitoring and warning technology for debris flow-A case study of the south cellar debris flow in the mountain Fang of Beijing[J]. Journal of Urban Geology, 2017, 12(1): 111–116. DOI:10.3969/j.issn.1007-1903.2017.01.020
[8] 李璐, 温宗周, 张阳阳, 等. 基于RBF神经网络滑坡灾害发生概率预报方法[J]. 西安工程大学学报, 2017, 31(4): 521–526.
Li L, Wen Z Z, Zhang Y Y, et al. Prediction method of landslide disaster occurrence probability based on RBF neural network[J]. Journal of Xi'an Polytechnic University, 2017, 31(4): 521–526.
[9] 董佳祺, 王清, 张旭东, 等. 泥石流堆积物粒度分布特征影响因素分析及分形维数预测[J]. 工程地质学报, 2015, 23(3): 462–468.
Dong J Q, Wang Q, Zhang X D, et al. Analysis of influencing factors of particle size distribution characteristics of debris flow deposits and prediction of fractal dimension[J]. Journal of Engineering Geology, 2015, 23(3): 462–468.
[10] 王常明, 田书文, 王翊虹, 等. 泥石流危险性评价:模糊c均值聚类——支持向量机法[J]. 吉林大学学报(地球科学版), 2016, 46(4): 1168–1175.
Wang C M, Tian S W, Wang Y H, et al. Debris flow risk assessment:fuzzy c-means clustering-support vector machine method[J]. Journal of Jilin University (Science Edition), 2016, 46(4): 1168–1175.
[11] Galiaskarov M R, Kurkina V V, Rusinov L A. Online diagnostics of time-varying nonlinear chemical processes using moving window kernel principal component analysis and Fisher discriminant analysis[J]. Journal of Chemometrics, 2017, 31: e2866. DOI:10.1002/cem.2866
[12] 刘磊, 杨鹏, 刘作军, 等. 采用核主成分分析和相关向量机的人体运动意图识别[J]. 机器人, 2017, 39(5): 661–669.
Liu L, Yang P, Liu Z J, et al. Human motion intention recognition using core principal component analysis and correlation vector machine[J]. Robot, 2017, 39(5): 661–669.
[13] Caggiano A. Tool wear prediction in Ti-6Al-4V machining through multiple sensor monitoring and PCA features pattern recognition[J]. Sensors, 2018, 18(3): 823. DOI:10.3390/s18030823
[14] 白朝阳, 胡子涵, 刘晓莹. 面向装备制造业的非平稳时间序列需求组合预测方法[J]. 信息与控制, 2017, 46(4): 495–502.
Bai C Y, Hu Z H, Liu X Y. Non-stationary time series demand combination prediction method for equipment manufacturing[J]. Information and Control, 2017, 46(4): 495–502.
[15] Tien Bui D, Tuan T A, Hoang N D, et al. Spatial prediction of rainfall-induced landslides for the Lao Cai area (Vietnam) using a hybrid intelligent approach of least squares support vector machines inference model and artificial bee colony optimization[J]. Landslides, 2017, 14(2): 447–458. DOI:10.1007/s10346-016-0711-9
[16] 冯腾飞, 钟钰, 刘小生, 等. 基于自适应人工蜂群算法优化的最小二乘支持向量机在变形预测中的应用[J]. 江西理工大学学报, 2018, 39(3): 35–39.
Feng T F, Zhong Y, Liu S S, et al. Application of least squares support vector machine based on adaptive artificial bee colony algorithm optimization in deformation prediction[J]. The Jiangxi University of Science and Technology Journal, 2018, 39(3): 35–39.
[17] Cheng K, Lu Z, Wei Y, et al. Mixed kernel function support vector regression for global sensitivity analysis[J]. Mechanical Systems & Signal Processing, 2017, 96: 201–214.
[18] 杨松, 李开林, 胡国清, 等. 基于FOA优化SOM-RBF的压力传感器温度补偿研究[J]. 仪表技术与传感器, 2018, 24(9): 1768–1773.
Yang S, Li K L, Hu G Q, et al. Research on temperature compensation of pressure sensor based on FOA optimization SOM-RBF[J]. Instrument Technique and Sensor, 2018, 24(9): 1768–1773.
[19] Rong-Bo L U, Chen L Y, Ding L, et al. Adaptive and robust watermarking scheme based on contourlet domain coefficients suppositional tree model and FOA-SVR[J]. Acta Electronica Sinica, 2017, 45(3): 674–679.
[20] 张亮, 陈练武. 陕西紫阳县磨子沟泥石流特征及危险性分析[J]. 四川地质学报, 2017(1): 104–107.
Zhang L, Chen S W. Characteristics and risk analysis of debris flow in Mozigou, Ziyang of Shaanxi Province[J]. Acta Geologica Sichuan, 2017(1): 104–107. DOI:10.3969/j.issn.1006-0995.2017.01.024
http://dx.doi.org/10.13976/j.cnki.xk.2019.9052
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

李丽敏, 程少康, 温宗周, 萧明伟, 徐根祺, 张顺锋
LI Limin, CHENG Shaokang, WEN Zongzhou, XIAO Mingwei, XU Genqi, ZHANG Shunfeng
基于改进KPCA与混合核函数LSSVR的泥石流预测
A Debris Flow Prediction Model Based on the Improved KPCA and Mixed Kernel Function LSSVR
信息与控制, 2019, 48(5): 536-544.
Information and Control, 2019, 48(5): 536-544.
http://dx.doi.org/10.13976/j.cnki.xk.2019.9052

文章历史

收稿/录用/修回: 2019-02-01/2019-06-27/2019-08-06

工作空间