基于盲动粒子群频率分解的极速学习机神经网络建模

文章快速检索

引用本文

刘加存, 梅其祥, 杨东红. 基于盲动粒子群频率分解的极速学习机神经网络建模[J]. 信息与控制, 2017, 46(1): 60-64. 复制到剪切板

LIU Jiacun, MEI Qixiang, YANG Donghong. ELM Neural Network Modeling Based on Frequency Decomposition with Blindfold Particle Swarm Optimization[J]. Information and Control, 2017, 46(1): 60-64. 复制到剪切板

基于盲动粒子群频率分解的极速学习机神经网络建模

刘加存, 梅其祥, 杨东红

广东海洋大学信息学院, 广东湛江 524088

收稿/录用/修回: 2016-02-01/2016-04-21/2016-05-18

基金项目: 国家自然科学基金资助项目（61272534）

作者简介: 梅其祥(1972-), 男, 博士, 副教授.研究领域为信号处理, 信息安全, 人工智能.
杨东红(1969-), 女, 硕士, 高级实验师.研究领域为理论电工, 计算机结构, 仪器仪表.

通讯作者: 刘加存(1962-), 男, 硕士, 副教授.研究领域为信号处理, 检测技术, 智能控制, zjouljc@126.com

摘要: 为了提高神经网络的泛化性，对输入信号进行频率分解.频率分解相对提升了子频带的信息致密性，覆盖全频域的子频带，也保证了信息的遍历性.高致密性和遍历性有助于提高神经网络的泛化性.频率分解由盲动粒子群优化算法自动完成，粒子群算法和通常的神经网络算法都用迭代计算，但计算需耗费较长时间，而采用一次就完成学习的极速学习神经网络可以节省计算时间.仿真结果表明，该神经网络泛化性好、精度高能满足一般工程应用.

关键词: 建模极速学习机(ELM) 神经网络频率分解盲动粒子群优化

ELM Neural Network Modeling Based on Frequency Decomposition with Blindfold Particle Swarm Optimization

LIU Jiacun, MEI Qixiang, YANG Donghong

College of Information, Guangdong Ocean University, Zhanjiang 524088, China

Abstract: In order to improve the generalization of a neural network model, input frequency is divided into sub-bands. These sub-bands enhance information compactness, and those which cover the full frequency ensure ergodicity. Higher compactness and ergodicity help to improve the generalization of the neural network. Frequency decomposition is performed by particle swarm optimization with a blindfold feature. Because particle swarm optimization and the usual neural network algorithm require an iterative calculation, they take a long time for execution. An extreme learning machine neural network with a one-time iteration is time efficient. Simulation results show that the generalization and accuracy of the neural network model are higher and can satisfy the demands of general engineering applications.

Key words: modeling ELM (extreme learning machine) neural network frequency decomposition blindfold particle swarm optimization

1 引言

泛化性好且精度高的数学模型，在各行各业中应用广泛.在众多的建模方法中，神经网络是非常重要的一种传统的神经网络，如BP (back propagation) 网络^[1-3]、径向基网络^[4-6](RBF) 等，所建模型泛化性不是太好，妨碍了其应用.并且，其学习迭代大多基于梯度下降算法，要耗费较长时间.

神经网络的输入信号一般使用的是一个原频谱的信号，若对其进行频率分解，就能突出各子频带的信息，提高信息的致密性.涵盖原始信号频谱的全部子频带也保证了信息的遍历性.较高的致密性和遍历性就能提高神经网络的精度和泛化性^[7].文[7]中的频率分解没有自动完成，有必要自动地经过不断地学习进行频率分解.

频率分解需迭代优化，神经网络一般也需迭代学习，两个步骤都存在迭代，就要耗费大量时间.若两个迭代取消一个就节省时间.基于极速学习机的神经网络^[8-12]一次计算就完成了学习，避免了该步骤的迭代.针对本文数据集，极速学习机学习约需5 s，40个隐节点的RBF网络学习约需10 min，即同样的数据集下，极速学习机学习速度大大加快.

粒子群优化算法^[13-17]对线性和非线性参数优化都有效.粒子群优化算法是模拟群体智能的算法，如蜂群、鸟群和蚁群等.本文采用蚁群的盲动特性对粒子群基本算法进行修缮以自动进行频率分解(以下简称频分)，得到优化分布的各子频带.

由此本文提出了一种基于盲动粒子群进行频分的ELM神经网络，用以离线建模.

2 盲动粒子群频分的ELM神经网络 2.1 频分的理论基础

设时域信号f(t) 满足绝对可积，则存在傅里叶变换对：

(1)

(2)

由式(1) 知，F(ω)=F(-ω).式(2) 变为

设对象的传递函数为G(s)，则输出的频率特性与输入的频率特性满足Y(ω)=G(ω)U(ω).有：

令0 < ω₁ < ω₂ < … < ω_n-1 < ω_n < ∞，则有：

(3)

若将式(3) 中右侧第1个积分里的G(ω) 用通频带为[0，ω₁]的理想低通滤波器G₀(ω) 代替且在该频带上满足G(ω)=G₀(ω)，第2个积分里的G(ω) 用通频带为[ω_n，∞]的理想高通滤波器G_n(ω) 代替且在该频带上满足G(ω)=G_n(ω)，第3个积分里的G(ω) 用通频带为[ω_k，ω_k+1]的理想带通滤波器G_k(ω) 代替且在该频带上满足G(ω)=G_k(ω)，则式(3) 变为

(4)

若G(ω) 事先不知，可用函数逼近算法逼近.式(4) 中各个积分是有界区间，在此进行有界区间内逼近即可.有理函数逼近精度高，本文采用有理函数型G_k(ω) 逼近G(ω).

定义少量描述曲线或曲面上几何形状的数据点叫型值点.

由文[18]知，若型值点满足一定的条件，有理插值就存在.

定义(m+n+1)×(m+n) 阶矩阵：

令.

定理1^[18] 设型值点(x_i，y_i)(i=0，1，…，m+n) 中x_i互异，有理插值R_m，n(x_i)=y_i有解的充要条件是各个矩阵A_i(i=0，1，2，…，m+n) 非奇异.其中，A_i是矩阵A去掉第i行后余下的元素按原来的结构次序构成的矩阵，.

定理2 有理插值函数R_0，1(x) 存在的充要条件是任一型值点都不在x轴上.

证明，此时有2个型值点(x₀，y₀) 和(x₁，y₁) 即可确定R_0，1(x). R_0，1(x) 对应的矩阵A=，只有2个A_i，即A₀=[y₁]，A₁=[y₀].若A₀非奇异，则det A₀=y₁≠0；若A₁非奇异，则det A₁=y₀≠0.

根据定理1，定理2得证，也即任一型值点都不在x轴上.证毕.

定理3 有理插值函数R_1，1(x) 存在的充要条件是任两型值点连线都不与x轴平行.

证明，此时有3个型值点(x₀，y₀)、(x₁，y₁) 和(x₂，y₂) 即可确定R_1，1(x). R_1，1(x) 对应的矩阵有3个A_i，即和.若A₀非奇异，det A₀=y₂-y₁≠0；若A₁非奇异，det A₁=y₂-y₀≠0；若A₂非奇异，det A₂=y₁-y₀≠0.

根据定理1，定理3得证.也即任两型值点连线都不与x轴平行.证毕.

定理4 有理插值函数R_0，2(x) 存在的充要条件是任一型值点都不在x轴上.

证明，有3个型值点(x₀，y₀)、(x₁，y₁) 和(x₂，y₂) 即可确定R_0，2(x). R_0，2(x) 对应的矩阵，只有3个A_i，即，.若A₀、A₁和A₂非奇异，则有：

根据定理1，定理4得证.也即任一型值点都不在x轴上.证毕.

定理5^[19] 有理插值函数R_1，2(x) 存在的充要条件是任3点都不在形如的曲线上.其中，R_1，2(x)=.

若G(ω) 在有界区间严格单调且不为0，就满足定理2~定理4，一般情况下定理5也能满足.本文采用R_0，1(x)、R_1，1(x)、R_0，2(x) 和R_1，2(x) 作为G_k(ω) 进行有界区间逼近.根据连续函数的性质，只要区间较小，逼近精度就较高.

R_0，1(x)、R_1，1(x)、R_0，2(x) 和R_1，2(x) 可看作滤波器，采用1阶Butterworth数字滤波器的设计方法就可求得各有理函数^[20].

Butterworth滤波器原型的幅频特性是：

其中，N是滤波器阶数，ω_c是通带截止频率.

2.2 盲动粒子群算法

粒子群智能优化算法是模拟蚁群觅食的仿生算法，其基本思想源于群体中个体之间信息的社会共享和协同进化.用以下数学过程表示PSO算法为：

种群X=[x₁，x₂，…，x_n]^T中有n个个体(粒子)，种群X的全局极值为G=[g₁，g₂，…，g_n]^T.其中，第i个粒子的速度和位置分别是v_i=[v_i₁，v_i₂，…，v_{i_n}]^T，x_i=[x_i₁，x_i₂，…，x_{i_n}]^T.个体极值P_i=[p_i₁，p_i₂，…，p_{i_n}]^T.在确定全局极值和个体极值后，传统的种群算法用下两式更新第i个粒子的速度和位置：

(5)

仔细观察蚂蚁个体的活动，除受群体信息和本体信息的影响外，也存在一定的盲目随机运动，在此对位置式(5) 进行改良，增加一个盲动项：

(6)

其中，α是盲动概率，其值选取0.05左右，标示着盲动不是总发生的.

目标函数是.此处N是采样点数，y_i是期望值，y_i^d是模型的输出值.

本文中每个粒子的长度代表滤波器个数，即X_i=[ω_ic1，ω_ic2，…，ω_icm]^T标示着有m个截止频率为ω_icx的滤波器.种群数是40，即i=1，2，…，40.利用本算法对每个ω_icx寻优，使目标函数最小化.解算步骤与基本粒子群算法类似^[13-17].

经数值计算仿真，其寻优效果更好.本文采用盲动粒子群算法对滤波器参数寻优.

盲动粒子群算法以3.1节的仿真来佐证.

2.3 频分ELM神经网络结构图

单输入单输出的ELM神经网络结构如图 1所示. 图 1中每个隐节点即是一个滤波器.低通滤波器对应R_0，1(x) 和R_0，2(x)；带通滤波器对应R_1，2(x)；全通滤波器对应R_1，1(x).

图 1 极速神经网络结构 Figure 1 The architecture of ELM neural network

图选项

当设计Butterworth滤波器时，此处的低通和带通滤波器通过选择滤波器的阶数和类型来确定.

隐含节点数的个数由采样频率f_s来确定，根据Shannon采样定理，一般采样频率越高表明信号的频带越宽，理应划分越多的子频带.经多次仿真测试，频带个数为n=2×round (2f_s^0.2).

与传统的神经网络比较，图 1也是3层结构，隐节点f₁，f₂，…，f_n是Butterworth滤波器.隐含层到输出层的权值w₁，w₂，…，w_n由极速学习机来确定.

2.4 极速学习机和网络学习

极速学习机用来确定w₁，w₂，…，w_n，令隐含层第i个节点的输出为f_i(i=1，2，…，n)，网络第k次采样输出如式(7) 所示：

(7)

也可用向量表示为

其中，N是采样点的个数，w=[w₁，w₂，…，w_n]^T，f(k)=[f₁(k)，f₂(k)，…，f_n(k)]^T全部采样值合在一起，可得矩阵方程(8)：

(8)

此处，

由式(8) 得

(9)

此处F⁺是广义逆--Moore-Penrose逆.式(9) 即是极速学习机的原理.

用盲动粒子群算法不断地更新滤波器f_i(i=1，2，…，n) 的参数，用式(9) 确定权向量w，使网络逼近精度越来越高，最终完成网络学习.

本网络的泛化性和精度由3.2节的仿真佐证.

3 频分极速神经网络仿真分析 3.1 盲动粒子群算法精度分析

选取3个对象：

式(4) 中的n=7有8个频段，即隐含层有8个节点.种群数是40个粒子，迭代150次.逼近误差如表 1所示.

表 1 盲动与无盲动粒子群最大相对误差 Table 1 The maximum relative errors of the blindfold and the non-blindfold particle swarms

误差	G₁(s)	G₂(s)	G₃
盲动	0.000 217 7	0.003 704 0	0.000 941 9
无盲动	0.005 403 7	0.004 388 7	0.000 942 8

表选项

从表 1的数据知，同样的条件下盲动粒子群算法的逼近精度高于无盲动的.对线性系统，精度提高较多.对非线性系统，精度提高较少.

最大相对误差是，即是最大误差比上量程.

3.2 频分ELM神经网络泛化性和精度分析

同样用以上的3个对象，用本文模型与常规RBF模型对比.

建模学习信号为

其中sawtooth为锯齿波函数.建模信号复杂，是为了有较高的遍历性.随意选取3个测试泛化性能的信号是：

测试时，神经网络的隐节点都取8个，学习150次.记录最大相对误差.

本文模型中网络输出值的数据如表 2所示.

表 2 本文模型的最大相对误差 Table 2 The maximum relative errors of the proposed model

信号	G₁(s)	G₂(s)	G₃
u(t)	0.000 219 5	0.000 518 2	0.000 942 4
u₁(t)	0.008 849 3	0.004 077 2	0.003 978 9
u₂(t)	0.000 741 0	0.000 779 5	0.002 489 0
u₃(t)	0.000 050 7	0.000 659 8	0.001 029 0

表选项

从表 2所得，学习时最大相对误差较小.用其它3个信号测试泛化性，最大相对误差稍大，在千分之几，精度有所下降，但千分之几的误差，是能满足一般工程需求的.比如就可用于一般工业自动控制领域的PID参数离线整定.

RBF模型中网络输出值的数据如表 3所示.

表 3 RBF模型的最大相对误差 Table 3 The maximum relative error of the RBF models

信号	G₁(s)	G₂(s)	G₃
u(t)	0.000 000 0	0.000 000 0	0.000 000 0
u₁(t)	3.301 710 9	2.333 406 6	5.165 852 8
u₂(t)	3.243 650 7	2.271 811 4	3.537 169 3
u₃(t)	1.231 739 6	0.917 577 4	1.363 363 9

表选项

从表 3所得，学习时最大相对误差为0.用其它3个信号测试泛化性，最大相对误差非常大，泛化性很差，不能满足一般工程需求的.

比较表 2和表 3知，本文模型的泛化性大大好于常规RBF的泛化性.千分之几的最大相对误差对应控制仪表的0.2~1.0精度等级，可用于工程中.

4 结论

用盲动粒子群频分ELM神经网络，对3个对象离线建模，泛化性达到千分之几的精度，可以应用于一般工程当中.仿真结果表明，本算法是有效的.如何进一步提高泛化精度，使最大相对误差达到万分之几的精度；如何进行在线建模是后续研究的方向.

参考文献

[1]	Yu F, Xu X Z. A short-term load forecasting model of natural gas based on optimized genetic algorithm and improved BP neural network[J]. Applied Energy, 2014, 134 (12): 102–113.

[2]	Xu Y J, You T, Du C L. An integrated micromechanical model and BP neural network for predicting elastic modulus of 3-D multi-phase and multi-layer braided composite[J]. Composite Structures, 2015, 122 (4): 308–315.

[3]	Cheng C, Cheng X S, Dai N. Prediction of facial deformation after complete denture prosthesis using BP neural network[J]. Computers in Biology and Medicine, 2015, 66 (11): 103–112.

[4]	Zhou F, Peng H, Qin Y, et al. RBF-ARX model-based MPC strategies with application to a water tank system[J]. Journal of Process Control, 2015, 34 : 97–116. DOI:10.1016/j.jprocont.2015.07.010

[5]	Qin Y, Peng H, Zhou F, et al. Nonlinear modeling and control approach to magnetic levitation ball system using functional weight RBF network-based state-dependent ARX model[J]. Journal of the Franklin Institute, 2015, 352 (10): 4309–4338. DOI:10.1016/j.jfranklin.2015.06.014

[6]	Herrera L J, Pomares H, Rojas I, et al. Global and local modelling in RBF networks[J]. Neurocomputing, 2011, 74 (16): 2594–2602. DOI:10.1016/j.neucom.2011.03.027

[7]	刘加存, 梅其祥, 李春辉. 基于频分神经网络和预测控制的PID参数整定研究[J]. 系统仿真学报, 2014, 26 (5): 1176–1179. Liu J C, Mei Q X, Li C H. The research of PID tuning based on frequency divide neural network and model predictive control[J]. Journal of System Simulation, 2014, 26 (5): 1176–1179.

[8]	Liu X, Wan A H. Universal consistency of extreme learning machine for RBFNs case[J]. Neurocomputing, 2015, 168 (11): 1132–1137.

[9]	Li J, Hua C, Tang Y, et al. A fast training algorithm for extreme learning machine based on matrix decomposition[J]. Neurocomputing, 2016, 173 (1): 1951–1958.

[10]	Shao Z F, Meng J E. An online sequential learning algorithm for regularized extreme learning machine[J]. Neurocomputing, 2016, 173 (1): 778–788.

[11]	刘菲菲, 彭荻, 贺彦林, 等.基于极限学习的过程神经网络研究及化工应用[J].上海交通大学学报, 2014, 48(7):977-981. Liu F F, Peng D, He Y L, Zhu Q X. Research and chemical application of extreme learning based process neural network[J]. Journal of Shanghai Jiao Tong University, 2014, 48(7):977-981. http://xuebao.sjtu.edu.cn/CN/Y2014/V48/I07/977

[12]	石红伟, 杨明红. 基于ELM的跨越前馈神经网络及其应用研究[J]. 现代电子技术, 2013, 36 (15): 108–111. Shi H W, Yang M H. Span feedforward neural network based on ELM and its application[J]. Modern Electronics Technique, 2013, 36 (15): 108–111.

[13]	Marinakis Y. An improved particle swarm optimization algorithm for the capacitated location routing problem and for the location routing problem with stochastic demands[J]. Applied Soft Computing, 2015, 37 (12): 680–701.

[14]	Jia Y F, Chi S C. Back-analysis of soil parameters of the Malutang Ⅱ concrete face rockfill dam using parallel mutation particle swarm optimization[J]. Computers and Geotechnics, 2015, 65 (4): 87–96.

[15]	Farahmand H, Rashidinejad M, Mousavi A. Hybrid mutation particle swarm optimisation method for available transfer capability enhancement[J]. Electrical Power and Energy Systems, 2012, 42 (11): 240–249.

[16]	余玉丰, 李国, 徐晨. 基于分组的PSO与DE的混合算法[J]. 计算机应用研究, 2014, 31 (8): 2294–2298. Yu Y F, Li G, Xu C. Hybrid algorithm based on grouped PSO and DE[J]. Application Research of Computers, 2014, 31 (8): 2294–2298.

[17]	Zhou X J, Yang C H, Gui W H, et al. A particle swarm optimization algorithm with variable random functions and mutation[J]. Acta Automatica Sinica, 2014, 40 (7): 1339–1347. DOI:10.1016/S1874-1029(14)60015-X

[18]	Macon N, Dupree D E. Existence and uniqueness of interpolating rational function[J]. American Mathematical monthly, 1962, 69 (8): 751–759. DOI:10.2307/2310771

[19]	唐杨新.有理函数逼近若干问题研究[D].合肥:合肥工业大学, 2009. Tang Y X, Some problem research on rational function approximants[D]. Hefei:Hefei University of Technology, 2009. http://cdmd.cnki.com.cn/Article/CDMD-10359-2009155885.htm

[20]	王大伟, 贾荣丛, 王划一. 基于Matlab的巴特沃斯滤波器设计[J]. 现代电子技术, 2012, 35 (21): 71–72. Wang D W, Jia R C, Wang H Y. Design of butterworth analog filter based on Matlab[J]. Modern Electronics Technique, 2012, 35 (21): 71–72.

http://dx.doi.org/10.13976/j.cnki.xk.2017.0060
中国科学院主管，中国科学院沈阳自动化研究所、中国自动化学会共同主办。

文章信息

刘加存, 梅其祥, 杨东红

LIU Jiacun, MEI Qixiang, YANG Donghong

基于盲动粒子群频率分解的极速学习机神经网络建模

ELM Neural Network Modeling Based on Frequency Decomposition with Blindfold Particle Swarm Optimization

信息与控制, 2017, 46(1): 60-64.

Information and Control, 2017, 46(1): 60-64.

http://dx.doi.org/10.13976/j.cnki.xk.2017.0060

文章历史

收稿/录用/修回: 2016-02-01/2016-04-21/2016-05-18

文章信息

文章历史

工作空间