文章快速检索  
  高级检索
基于模糊信息粒化与混合神经网络的混沌时间序列预测
孙天宝, 刘媛华    
上海理工大学管理学院, 上海 200093
摘要: 为了提高对混沌时间序列预测的精准度,提出了一种基于模糊信息粒化和注意力机制的混合神经网络预测模型。首先对数据进行归一化处理,利用模糊信息粒化对数据的复杂度进行简化;然后将经过相空间重构后的样本输入卷积神经网络(CNN)提取空间特征;再利用长短期记忆神经网络(LSTM)进一步提取时间特征;最后将融合特征传递给注意力机制提取关键特征,得出预测结果。选取Logistic、洛伦兹和太阳黑子混沌时间序列进行实验,并与CNN-LSTM-Att模型、CNN-LSTM模型、FIG-CNN模型、FIG-LSTM模型、CNN模型、LSTM模型、支持向量机(SVM)及误差逆传播(BP)模型进行对比分析。结果表明,所提的预测模型预测精度更高,误差更小。
关键词: 混沌时间序列    模糊信息粒化    卷积神经网络    长短期记忆神经网络    注意力机制    
Chaotic Time Series Prediction Based on Fuzzy Information Granulation and Hybrid Neural Network
SUN Tianbao, LIU Yuanhua    
Business School, University of Shanghai for Science & Technology, Shanghai 200093, China
Abstract: To improve the prediction accuracy of chaotic time series, we propose a hybrid neural network prediction model based on fuzzy information granulation and an attention mechanism. First, we normalize the data, simplify the complexity of the data using fuzzy informational granulation (FIG), and then add the samples reconstructed from phase space into a convolution neural network (CNN) to extract spatial features. Next, we use the long short-term memory network (LSTM) to further extract the temporal features. Finally, we transmit the fusion features to the attention mechanism to extract the key features and obtain the prediction results. We select Logistic, Lorenz, and sunspot chaotic time series for experiments and compare the model with the CNN-LSTM-Att, CNN-LSTM, FIG-CNN, FIG-LSTM, CNN, and LSTM models, and support vector machine (SVM) and error back propagation (BP) neural network model. The results show that the proposed prediction model has a higher prediction accuracy and a smaller error value.
Keywords: chaotic time series    fuzzy information granulation    convolutional neural network    long-short term memory network    attention mechanism    

0 引言

混沌是一种普遍存在于自然系统和社会系统中的运动现象,它的发现打破了系统的随机性和确定性相互对立、矛盾的传统观点,并在各个学科领域中得到了广泛的应用,如交通[1]、通信[2]、电力[3]、社会经济[4]、生物医学[5]等。由于混沌系统对于初始值异常敏感,因此任何一个影响系统的微小扰动在一段时间后都将成指数倍放大,这就导致系统的长期预测变得渺茫,而混沌系统中任一变量中都蕴含着其它各个变量演化的全部信息,这个特点又使得其本身具有内在的确定性,这也为混沌时间序列的短期预测创造了可能[6]。因此,如何还原出原始系统在高维度上的动力学特性并预测出其未来运动趋势,成为混沌领域一直以来的研究热点。Xia等[7]提出了一种鲁棒损失函数来消除噪声对混沌时间序列的影响,通过模型对噪声的敏感程度来对损失函数进行改进,以此达到鲁棒建模的目的。韩敏等[8]提出了一种储备池在线稀疏学习算法,利用在线求解回声状态网络输出权值对非平稳混沌时间序列进行预测,在输出权值中加入稀疏约束,并采用截断梯度法在线求近似解,在不损失预测精度的同时,有效提高了模型的泛化能力。Chen等[9]提出一种量化核最小均方模型,其核心思想是将原始数据矢量量化,使输入或特征空间被压缩,以此来遏制自适应滤波器中核矩阵的增长,但该方法仅适合短期的混沌时间序列预测。Han等[10]提出了一种自适应归一化稀疏量化核递归最小二乘算法来对多变量混沌时间序列进行在线预测,该算法在具有实时动态变化的复杂系统建模中表现出较高的计算效率和预测精度。李琨等[11]提出一种基于改进黑洞算法和最小二乘支持向量机的预测模型来对抽油井动液面进行短期预测,该模型以嵌入维数、延迟时间、正则化参数与核函数定为优化目标,避免了设定主观参数,提高了预测模型的鲁棒性。卢英东等[12]提出一种基于遗传算法优化注意力机制的深度长短期记忆网络,在深度挖掘时间序列的潜在特征的同时避免了网络陷入局部最优,模型在电力系统的混沌预测中表现出较好的预测效果。黄伟建等[13]提出一种融合注意力机制的混合神经网络,提取混沌时间序列的空间特征后融合原序列进一步提取时间特征,降低了模型预测误差。但是,上述研究方法没有同时考虑时间序列噪声的影响以及数据特征的多维提取问题,且模型预测精度和泛化能力有待进一步提高。

为了解决上述问题,本文结合混沌时间序列相空间重构原理,提出了一种基于模糊信息粒化和注意力机制的混合神经网络预测模型(FIG-CNN-LSTM-Att)。首先,对数据进行归一化处理,以提升模型运行效率;其次,采用三角形模糊粒子对处理后的数据进行模糊信息粒化,在降低噪声的同时简化数据的复杂度;再次,运用相空间重构理论还原出混沌时间序列的原动力系统,以相空间中的相点作为样本集输入卷积神经网络(CNN)和长短期记忆神经网络(LSTM)组成的混合模型中提取样本的时空特征;最后,引入注意力机制(Att)提取融合特征的关键部分,并输出预测结果。分别将Logistic、洛伦兹和太阳黑子混沌时间序列输入模型进行仿真实验,结果表明本文提出的预测模型具有更好的预测精度和较低的预测误差。

1 研究方法 1.1 模糊信息粒化

信息粒化就是通过信息颗粒功能的相似性、不可区分性和函数性来人为地对对象集合进行重新组合划分。基于美国数学家Zadeh[14]提出的模糊集合理论,对解决模糊信息粒化问题的方法进行了研究,该方法给大部分缺少先验信息的研究提出了一种数据粒的具体命题刻画:

(1)

其中,x为取值变量,G为能合理描述原序列的模糊子集,它由隶属函数QA来刻画,λ是可能性概率。

具体的隶属函数通过式(2)来确定:

(2)

其中,M(A)能保证粒子合理代表原始数据,N(A)能保证粒子具有一定特殊性。

模糊信息粒化的建模过程包括两个步骤:

1) 确定划分窗口w,将原始时间序列分割为诸多子序列。

2) 建立模糊粒子,在给定的子序列X=(x1x2…,xk)上建立一个模糊粒子A,使其隶属度和最大化,粒子支撑最小化。

本文实验中采用三角形模糊粒子对数据进行处理,隶属函数表达式:

(3)

其中,x代表论域中的变量;amb是模型参数,分别对应原始数据变化的最小值、大体平均值和最大值。

1.2 相空间重构理论

相空间重构理论主要目的是用单一的系统输出时间序列来近似恢复出原系统的混沌吸引子,且这个吸引子用一组能表征出原系统动力学特性的坐标分量来表示。根据Takens[15]提出的嵌入定理,确定嵌入维数和延迟时间,即可重构出高质量的吸引子。本文采用G-P算法[16]来确定嵌入维数m,用互信息法(mutual information)[17]来确定延迟时间τ

对于在实验当中采集到的混沌时间序列x(ti)=[x(t1),x(t2),…,x(tn)],n为序列样本数。用时间延迟法来构造出M(M=N-(m-1)τ)个m维相空间矢量:

(4)

用矩阵表示的重构空间轨道:

(5)

式中,mτ分别代表嵌入维数与延迟时间,XM×m维矩阵。

1.3 1维卷积神经网络(1DCNN)

卷积神经网络常用于处理具有网格状拓扑的数据,根据处理数据的结构类型和卷积核在输入张量上的移动方式,将卷积网络分为1维卷积、2维卷积和3维卷积,无论哪种CNN模型,其基本组成都包括输入层、输出层、卷积层、池化层和全连接层。本文数据类型为1维时间序列,故采用1维卷积神经网络[18]对数据集进行训练。1DCNN在进行卷积操作时会按照一固定方向提取数据的平移特征,以此来达到局部连接和权值共享的目的,这样可以显著减少训练参数的数量,提高网络运行效率。卷积过程如图 1所示。在数学上解释为循环乘积和累加,其表达式为

图 1 1维卷积神经网络 Fig.1 One dimensional convolutional network
(6)

其中,f(x)表示重构后的时间序列,g(x)表示卷积核,h(x)为卷积后的新序列,N表示序列g(x)的长度。

1.4 长短期记忆神经网络

长短期记忆神经网络是一种门控循环神经网络,相较于传统的循环神经网络能更好地捕获数据间的长期依赖[19],并有效避免梯度消失的问题。它将常规的神经元替换为存储单元,每个存储单元都由遗忘门ft、输入门it和输出门ot构成,其结构如图 2所示,其中,遗忘门决定上一时刻的记忆单元中哪些信息可以从单元中剔除,输入门决定当前时刻哪些信息可以存储在单元中,输出门决定哪些信息需要输出并输出信息,这3个门控由sigmoid激活函数来控制是否被触发,以此来达到控制信息流动的目的。LSTM单元计算公式为

图 2 LSTM结构 Fig.2 The structure of LSTM
(7)
(8)
(9)
(10)
(11)
(12)

式中,xt代表当前时刻的输入值,ht-1ht分别代表上一时刻和当前时刻输出值,ct-1ct分别代表上一时刻和当前时刻的单元状态,cm表示候选单元状态,WfWiWo分别代表遗忘门、输入门和输出门的权重矩阵,bfbibobc代表对应各自的偏置量,σ为sigmoid函数。

1.5 注意力机制

注意力机制[20]的灵感来自于人类对认知事物的生理感知,这种机制可以使得无关或次要信息被忽略掉,只保留能反映事物所要表达的主要信息。引入注意力机制的神经网络可以使模型动态地关注输入的特定部分,从而更加高效地完成学习任务。

通常实际观察到的混沌时间序列同样含有非关键特征[21],这些非关键特征会干扰模型的泛化能力,从而影响预测准确率。因此,本文在混合神经网络中引入注意力机制对序列特征做进一步提取,其结构如图 3所示。将LSTM模块时间步长数个值输入注意力模块来自动学习注意力权重αij,学习到的权重与原始输入值再做乘积,以此来自动捕获存储单元中隐藏状态之间的相关性。它本质上就是通过加权求和操作来构建内容向量cj,其数学表达式为

图 3 注意力机制模型 Fig.3 Attention mechanism model
(13)

其中,αij为节点位置的注意力权重,hi为存储单元隐藏状态,m为输入LSTM网络的时间步长。

2 混合神经网络预测模型构建

由于实际观察到的混沌时间序列不仅具有伪随机的特性,同时还含有一定的噪声,因此无法直接观察到其蕴含的动力学特性,相空间重构可以很好地还原出原序列对应的动力系统,而信息粒化可以将相近的序列进行整合划分,大大简化样本,具有一定的去噪能力。神经网络模型具有出色的处理非线性数据的能力,引入神经网络可以提取出混沌时间序列的空间和时间特征。本文提出FIG-CNN-LSTM-Att模型来对混沌时间序列进行预测,模型框架如图 4所示。其中FIG模块用于对时间序列进行模糊信息粒化,CNN模型用于提取重构时间序列的空间特征,利用LSTM模型提取相空间的时间特征,最后加入Att模块,将LSTM的输出值按一定步长数输入到注意力模块中,学习每个数值的权重,然后与原输入值累积求和,以此来进一步捕获时空特征的关键部分,提高模型的运行效率和预测精准度。

图 4 FIG-CNN-LSTM-Att模型 Fig.4 FIG-CNN-LSTM-Att model

FIG-CNN-LSTM-Att模型算法步骤为:

步骤1   数据归一化。将实验的混沌时间序列处理成均值为0、振幅为1的归一化时间序列:

(14)

式中,y(i)为原时间序列,x(i)为归一化后的时间序列。

步骤2   信息粒化。确定粒化窗口w的大小,选取三角模糊粒子隶属函数在划分出的每个子序列上构建模糊集,形成一个新的样本序列。

步骤3   相空间重构。对信息粒化后的新的样本序列分别采用G-P算法来确定嵌入维数m,用互信息法来确定延迟时间τ,重构对应的相空间。

步骤4   构建卷积神经网络。对重构后相空间中的相点进行卷积操作,提取空间特征。

步骤5   构建长短期记忆网络。将卷积层提取到的空间特征作为LSTM的输入,进一步提取序列的时间特征。

步骤6   注意力机制。对LSTM内部隐藏状态进行加权组合,学习每个特征的注意力权重,整体求和后最终输出预测值。

3 仿真实验分析

本文选取Logistic、洛伦兹和太阳黑子混沌时间序列作为实验的数据集,在IntelCoreTM i7-6500U(4核),内存8 GB,Win10 64位操作系统,编程语言为Python的开发环境中进行仿真实验。为验证FIG-CNN-LSTM-Att模型的预测能力,选取未加入信息粒化的CNN-LSTM-Att模型、未加入注意力机制的CNN-LSTM模型、单一的CNN模型、LSTM模型及SVM和BP模型进行误差对比。采用均方误差(RMSE)、平均绝对值百分比误差(MAPE)、平均绝对误差(MAE)及均方根百分比误差(RMSPE)四个评价指标来分别对模型预测能力进行评价,其中,RMSE与RMSPE中含有平方项,对残差离群值更敏感,即会惩罚绝对值大于1的残差,而奖励绝对值小于1的残差,其值越接近于0代表拟合程度越好,MAPE与MAE表示预测值偏离真实值的平均程度,属于基本无偏的指标,对残差没有奖惩偏好,对离群值的敏感性不高。评价指标数学表达式:

(15)
(16)
(17)
(18)

式中,N为预测样本总数,yiyi分别代表样本真实值和预测值。

3.1 Logistic时间序列预测

选取的典型非线性系统Logistic混沌映射方程表达式为

(19)

μ=4,初始值x0=0.1时方程产生的混沌序列,舍弃前10 000个数值,取之后的3 000个数据以此来保证数据的纯混沌性。采用三角形模糊集对该混沌序列进行模糊信息粒化,窗口大小设定为5,粒化后的效果如图 5所示。Low、R、Up分别代表模糊粒子的3个参数,并对应原始序列数据变化的最小值、大体平均值和最大值。然后分别将这3组粒化后的数据进行相空间重构。由于篇幅有限,本文只对序列R进行研究讨论,利用G-P算法确定的嵌入维数m=2,用互信息法来确定的延迟时间τ=1。最终在相空间中得到598个相点,按照8∶2的比例划分训练集和测试集,然后输入FIG-CNN-LSTM-Att模型进行训练。预测结果和预测误差如图 6图 7所示,表 1给出了FIG-CNN-LSTM-Att模型与其他模型的预测结果对比。

图 5 Logistic序列模糊信息粒化 Fig.5 Fuzzy information granulation of Logistic series
图 6 Logistic序列预测 Fig.6 Logistic series prediction
图 7 Logistic序列预测相对误差 Fig.7 Relative error of logistic series prediction
表 1 Logistic序列的模型误差对比 Tab.1 Model error comparison of Logistic series
模型 RMSE MAPE MAE RMSPE
FIG-CNN-LSTM-Att 0.006 2 0.026 1 0.003 0 0.058 9
CNN-LSTM-Att 0.034 2 0.072 8 0.025 9 0.113 5
CNN-LSTM 0.066 7 0.111 3 0.050 2 0.129 4
FIG-LSTM 0.021 5 0.038 9 0.006 8 0.059 8
FIG-CNN 0.016 7 0.094 8 0.078 3 0.192 8
LSTM 0.041 5 0.042 0 0.009 0 0.080 0
CNN 0.025 4 0.033 6 0.091 0 0.365 3
SVM 0.075 7 18.090 7 0.068 1 32.797 1
BP 0.014 6 2.407 1 0.011 9 0.128 9

通过图 6图 7能明显观察到本文提出的FIG-CNN-LSTM-Att模型较好地拟合出了Logistic混沌时间序列的运动趋势,并且真实值与预测值误差很小,说明该模型有着非常好的预测效果和预测精度。通过表 1可以看出,本文提出的FIG-CNN-LSTM-Att模型的4项误差指标都优于用于对比的其他8个模型,与未加入模糊信息粒化处理模块的CNN-LSTM-Att模型相比预测精度有大幅度的提高。为进一步验证信息粒化的作用,增加FIG-LSTM和FIG-CNN模型与单一的LSTM、CNN模型进行对比,实验结果显示引入信息粒化模块能有效整合Logistic数据集里的关键信息,减少非关键特征对模型的影响,进而提高模型的预测精度。通过CNN-LSTM-Att与CNN-LSTM的预测误差对比可以看出,注意力机制能在一定程度上提高模型对关键特征提取的能力,减小预测误差。从整体来看,单一LSTM模型在Logistic数据集上的预测效果要优于CNN-LSTM混合模型,这说明混合模型也增加了非关键特征的提取,因此降低了整体模型的预测精度。在RMSE与MAPE指标下CNN模型要优于LSTM模型,而在MAE与RMSPE指标下LSTM模型要优于CNN模型,这说明Logistic数据集的空间特征和时空特征有着相近的重要程度。从结果来看,本文提出的模型对这两种特征的提取效果显著,且预测精度更高。

为了全面评价本文提出的模型的预测性能,表 2中列出了各个模型在Logistic数据集中的运行时间来进行对比分析。可以看出,SVM与BP模型用时相对很少,但预测精准度很低。由于CNN-LSTM模型结构复杂,所以运行时间要比单一的CNN、LSTM模型要多。引入注意力机制后的CNN-LSTM模型运行效率提高了约14%,CNN-LSTM-Att模型与LSTM模型在引入信息粒化模块后运行效率分别提高了约74%和77%,CNN模型在引入信息粒化模块后模型运行效率提升了约73%,但在RMSE、MAE与RMSPE指标下模型预测精度有所降低,这说明信息粒化在剔除Logistic数据集的冗余特征的同时,也会损耗部分空间特征,但综合来看,本文提出的模型仍然具有显著优势。

表 2 Logistic序列的模型运行时间对比 Tab.2 Comparison of model running time of Logistic series
模型 运行时间/s
FIG-CNN-LSTM-Att 314.2
CNN-LSTM-Att 1 187.4
CNN-LSTM 1 382.5
FIG-LSTM 252.9
FIG-CNN 131.9
CNN 482.3
LSTM 1 103.4
SVM 12.8
BP 23.1
3.2 洛伦兹时间序列预测

本例选取的洛伦兹混沌映射方程表达式为

(20)

取参数a=10,c=30,b=8/3,初始值为x=y=z=1时方程产生的混沌序列,在系统中的x分量产生的混沌序列中舍弃前10 000个数值,取之后的3 000个数据以此来保证数据的纯混沌性。采用三角形模糊集对该混沌序列进行模糊信息粒化,窗口大小设定为4,粒化后的效果如图 8所示。同样选取粒化后的序列R作为重构序列。用G-P算法确定的嵌入维数m=3,用互信息法来确定的延迟时间τ=7。最终在相空间中得到735个相点,按照8∶2的比例划分训练集和测试集,然后输入FIG-CNN-LSTM-Att模型进行训练。预测结果和预测误差如图 9图 10所示,表 2给出了FIG-CNN-LSTM-Att模型与其他模型的预测结果对比。

图 8 洛伦兹序列模糊信息粒化 Fig.8 Fuzzy information granulation of Lorenz series
图 9 洛伦兹序列预测 Fig.9 Lorenz series prediction
图 10 洛伦兹序列预测相对误差 Fig.10 Relative error of Lorenz series prediction

图 9图 10体现出本文提出的FIG-CNN-LSTM-Att模型对洛伦兹混沌时间序列关键特征提取的有效性以及较高的预测精准度,通过表 3列举的4项指标可以看出本文提出的FIG-CNN-LSTM-Att模型预测效果仍是最优的,与CNN-LSTM-Att模型相比对原始数据关键信息的提取能力更强。通过CNN-LSTM-Att与CNN-LSTM模型对比可以看出,注意力机制在对洛伦兹数据集上特征的进一步提取效果有限。值得注意的是CNN-LSTM模型对洛伦兹数据集的预测效果低于LSTM模型,这说明卷积部分提取到过多的非关键特征降低了模型的预测精度,从CNN与LSTM模型预测误差对比中可以看出,重构后的洛伦兹数据集在空间上的特征重要程度低于时空特征,CNN-LSTM混合模型的非关键特征主要源于卷积操作。引入信息粒化后的CNN与LSTM模型的预测精度波动范围较小,说明信息粒化能够很好地对洛伦兹数据样本进行简化并较大限度地保留关键特征。从表 4可以看出,在运行时间方面,CNN-LSTM模型在引入注意力机制后,运行效率提高约14%,CNN-LSTM-Att模型、单一的CNN和LSTM模型在引入信息粒化后运行效率分别提高约73%、69%和74%。SVM与BP模型虽然用时较少,但在MAE指标下预测精度较低,综合对比下,本文提出的模型仍然具有较高的预测性能。

表 3 洛伦兹序列的模型误差对比 Tab.3 Model error comparison of Lorenz series
模型 RMSE MAPE MAE RMSPE
FIG-CNN-LSTM-Att 0.004 2 0.026 5 0.003 1 0.253 8
CNN-LSTM-Att 0.085 8 0.399 2 0.049 1 1.132 9
CNN-LSTM 0.088 9 0.616 3 0.058 8 1.258 1
FIG-LSTM 0.130 6 0.182 1 0.250 0 0.207 3
FIG-CNN 8.230 7 2.947 9 5.436 3 14.538 7
LSTM 0.116 5 0.361 0 0.329 5 0.282 4
CNN 8.501 2 2.466 6 5.365 3 14.770 6
SVM 0.047 4 10.609 3 0.088 1 0.347 0
BP 0.505 8 25.486 5 0.332 8 1.495 6
表 4 洛伦兹序列的模型运行时间对比 Tab.4 Comparison of model running time of Logistic series
模型 运行时间/s
FIG-CNN-LSTM-Att 405.6
CNN-LSTM-Att 1 526.1
CNN-LSTM 1 816.7
FIG-LSTM 318.2
FIG-CNN 168.3
CNN 549.8
LSTM 1 210.2
SVM 14.7
BP 19.1
3.3 太阳黑子时间序列预测

FIG-CNN-LSTM-Att模型在Logistic和洛伦兹这两个理论混沌系统中有着出色的表现,为了验证模型对现实世界里真实动力系统的预测效果,本例选取1755年—2020年的太阳黑子时间序列样本集来对模型预测能力进行检验。采集太阳黑子数据共计3 240条,粒化窗口大小为2,粒化效果如图 11所示,对粒化后的序列R进行计算得嵌入维数m=3,延迟时间τ=10,重构相空间后得相点1 559个,按照8∶2的比例划分训练集和测试集,然后输入FIG-CNN-LSTM-Att模型进行训练。预测结果和预测误差如图 12图 13所示,FIG-CNN-LSTM-Att模型与其他模型的预测结果对比如表 3所示。

图 11 太阳黑子模糊信息粒化 Fig.11 Fuzzy information granulation of sunspot series
图 12 太阳黑子序列预测 Fig.12 Sunspot series prediction
图 13 太阳黑子序列预测相对误差 Fig.13 Relative error of sunspot series prediction

图 12图 13同样可以看出FIG-CNN-LSTM-Att模型在太阳黑子数据集上表现出了良好的预测效果,表 5中CNN模型的4项指标与其他模型有较大差异,说明太阳黑子混沌时间序列的空间特征并不显著,从MAPE与RMSPE这两个指标来看,虽然CNN-LSTM模型在卷积部分提取到了部分冗余特征,但在加入注意力机制后模型整体预测效果要好于单一的LSTM模型,这说明注意力机制让关键的空间特征也发挥了作用。引入模糊信息粒化后模型预测效果又得到显著提升。从表 6的运行时间对比中可以看出,引入注意力机制的CNN-LSTM模型运行效率提高了约27%,CNN-LSTM-Att模型、单一的CNN和LSTM模型在引入信息粒化后运行效率分别提高约51%、53%和46%。综合各模型的预测精度和运行时间分析,本文提出的模型在实际的混沌时间序列预测中依然表现较好的预测性能。

表 5 太阳黑子序列的模型误差对比 Tab.5 Model error comparison of sunspot series
模型 RMSE MAPE MAE RMSPE
FIG-CNN-LSTM-Att 0.017 3 0.069 4 0.009 2 0.109 6
CNN-LSTM-Att 0.040 2 0.099 5 0.030 1 0.129 8
CNN-LSTM 0.044 3 0.328 3 0.039 0 0.586 6
FIG-LSTM 1.016 0 0.062 1 0.245 2 0.200 8
FIG-CNN 45.254 1 2.606 8 48.341 0 9.519 5
LSTM 1.459 1 0.184 8 0.752 1 0.550 0
CNN 50.321 4 5.604 7 41.849 7 11.972 8
SVM 0.053 1 23.250 0 0.046 7 1.181 8
BP 2.603 0 11.932 8 1.850 0 0.238 2
表 6 太阳黑子序列的模型运行时间对比 Tab.6 Comparison of model running time of sunspot series
模型 运行时间/s
FIG-CNN-LSTM-Att 830.8
CNN-LSTM-Att 1 712.8
CNN-LSTM 2 359
FIG-LSTM 723.3
FIG-CNN 320.9
CNN 683.9
LSTM 1 336.4
SVM 15.5
BP 25.4
4 结论

本文利用模糊信息粒化、CNN-LSTM混合神经网络和注意力机制,提出了一种用于预测混沌时间序列的FIG-CNN-LSTM-Att模型。通过在Logistic、洛伦兹和太阳黑子混沌时间序列上分别进行测试,证明了本文提出的模型优于其他对比模型的预测效果。

在FIG-CNN-LSTM-Att模型中,模糊信息粒化在有效保留样本特征的情况下大幅降低样本复杂度,有效消除了冗余信息,显著提升了模型的运行效率,再结合相空间重构理论,利用CNN模型对相空间中的相点进行空间特征提取,在提取的空间特征基础上引入LSTM模型进一步提取蕴含的时间特征。添加注意力机制对关键特征进行筛选,进而提高模型预测精度。实验表明,本文提出的模型在选取的3种混沌时间序列中的预测效果都取得了较好的效果,并且预测误差都控制在较低的范围之内。

参考文献
[1]
Ma Q, Huang G H, Ullah S. A multi-parameter chaotic fusion approach for traffic flow forecasting[J]. IEEE Access, 2020, 8: 774-781.
[2]
张刚, 和华杰, 张鹏. 降噪改进型多载波CDSK混沌通信系统[J]. 系统工程与电子技术, 2021, 43(5): 1389-1397.
Zhang G, He H J, Zhang P. Noise reduction improved multi-carrier CDSK chaotic communication system[J]. Systems Engineering and Electronics, 2021, 43(5): 1389-1397.
[3]
Wan Y. Chaotic power division multiplexing for secure optical multiple access[J]. Journal of Lightwave Technology, 2022, 40(4): 968-978. DOI:10.1109/JLT.2021.3124904
[4]
徐争辉, 刘友金, 谭文, 等. 一个对称分数阶经济系统混沌特性研究[J]. 系统工程理论与实践, 2014, 34(5): 1237-1242.
Xu Z H, Liu Y J, Tan W, et al. Study on chaotic characteristics of a symmetric fractional order economic system[J]. System Engineering Theory & Practice, 2014, 34(5): 1237-1242.
[5]
Li X, Wu F, Muhammad K K, et al. A secure chaotic map-based remote authentication scheme for telecare medicine information systems[J]. Future Generation Computer Systems, 2018, 84: 149-159. DOI:10.1016/j.future.2017.08.029
[6]
Packard N H, Crutchfleld J P, Farmer J D, et al. Geometry from a time series[J]. Physical Review Letters, 1980, 45(9): 712-716. DOI:10.1103/PhysRevLett.45.712
[7]
Xia Y, Wang J. Robust regression estimation based on low-dimensional recurrent neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2018, 29(12): 5935-5946. DOI:10.1109/TNNLS.2018.2814824
[8]
韩敏, 王新迎. 一种有效的储备池在线稀疏学习算法[J]. 自动化学报, 2011, 37(12): 1536-1540.
Han M, Wang X Y. An effective online sparse learning algorithm for reserve pool[J]. Acta Automatica Sinica, 2011, 37(12): 1536-1540.
[9]
Chen B, Zhao S, Zhu P, et al. Quantized kernel least mean square algorithm[J]. IEEE Transactions on Neural Networks and Learning Systems, 2011, 23(1): 22-32.
[10]
Han M, Zhang S, Xu M, et al. Multivariate chaotic time series online prediction based on improved kernel recursive least squares algorithm[J]. IEEE Transactions on Cybernetics, 2018, 49(4): 1160-1172.
[11]
李琨, 韩莹, 黄海礁. 基于IBH-LSSVM的混沌时间序列预测及其在抽油井动液面短期预测中的应用[J]. 信息与控制, 2016, 45(2): 241-247, 256.
Li K, Han Y, Huang H Q. Chaotic time series prediction based on IBH-LSSVM and its application in short-term prediction of dynamic liquid level in pumping wells[J]. Information and Control, 2016, 45(2): 241-247, 256.
[12]
卢英东, 韦笃取. 基于遗传注意力机制的DLSTM的电力系统混沌预测[J]. 计算物理, 2022, 39(3): 371-378.
Lu Y D, Wei D Q. Power system chaos prediction based on DLSTM with genetic attention mechanism[J]. Computational Physics, 2022, 39(3): 371-378.
[13]
黄伟建, 李永涛, 黄远. 基于混合神经网络和注意力机制的混沌时间序列预测[J]. 物理学报, 2021, 70(1): 235-243.
Huang W J, Li Y T, Huang Y. Chaotic time series prediction based on hybrid neural network and attention mechanism[J]. Journal of Physics, 2021, 70(1): 235-243.
[14]
Zadeh L A. Towards a theory of fuzzy information granulation and its centrality in human reasoning and fuzzy logic[J]. Fuzzy Sets and System, 1997, 90(2): 111-127.
[15]
Takens F, Rand D A, Young L S. Dynamical systems and turbulence[J]. Lecture Notes in Mathematics, 1981, 4: 336-341.
[16]
高俊杰, 王豪. 基于改进的G-P算法的相空间嵌入维数选择[J]. 计算机工程与应用, 2014, 50(9): 107-110.
Gao J J, Wang H. Phase space embedding dimension selection based on improved G-P algorithm[J]. Computer Engineering and Application, 2014, 50(9): 107-110.
[17]
张春涛, 刘学飞, 向瑞银, 等. 基于最大互信息的混沌时间序列多步预测[J]. 控制与决策, 2012, 27(6): 941-944.
Zhang C T, Liu X F, Xiang R Y, et al. Multi-step-prediction of chaotic time series based on maximized mutual information[J]. Control and Decision, 2012, 27(6): 941-944.
[18]
黎阳羊, 胡金磊, 赖俊驹, 等. 基于1D-CNN-LSTM混合神经网络模型的风电机组行星齿轮箱故障诊断[J]. 电气自动化, 2021, 43(5): 20-22.
Li Y Y, Hu J L, Lai J J, et al. Fault diagnosis of wind turbine planetary gearbox based on 1D-CNN-LSTM0 hybrid neural network model[J]. Electrical Automation, 2021, 43(5): 20-22.
[19]
Ali A, Ahmed A, Moussa L, et al. Short-term self consumption PV plant power production forecasts based on hybrid CNN-LSTM, ConvLSTM models[J]. Renewable Energy, 2021, 177: 101-112.
[20]
陈港, 张石清, 赵小明. 结合数据平衡和注意力机制的CNN+LSTM的自然语音情感识别[J]. 计算机系统应用, 2021, 30(5): 269-275.
Chen G, Zhang S Q, Zhao X M. Natural speech emotion recognition based on CNN+LSTM combined with data balance and attention mechanism[J]. Computer System Application, 2021, 30(5): 269-275.
[21]
廖雪超, 邓万雄. 基于两级分解和长短时记忆网络的短期风速多步组合预测模型[J]. 信息与控制, 2021, 50(4): 470-482.
Liao X C, Deng W X. Multi step combined prediction model of short-term wind speed based on two-level decomposition and long-term and short-term memory network[J]. Information and Control, 2021, 50(4): 470-482.
http://dx.doi.org/10.13976/j.cnki.xk.2022.2018
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

孙天宝, 刘媛华
SUN Tianbao, LIU Yuanhua
基于模糊信息粒化与混合神经网络的混沌时间序列预测
Chaotic Time Series Prediction Based on Fuzzy Information Granulation and Hybrid Neural Network
信息与控制, 2022, 51(6): 671-679.
Information and Control, 2022, 51(6): 671-679.
http://dx.doi.org/10.13976/j.cnki.xk.2022.2018

文章历史

收稿/录用/修回: 2022-01-12/2022-03-15/2022-04-06

工作空间