2. 计算智能与智能系统北京市重点实验室, 北京 100124
2. Beijing Key Laboratory of Computational Intelligence and Intelligent System, Beijing 100124, China
1 引言
氨氮(ammonia nitrogen,NH4-N)是衡量水体受污染程度的重要评价指标,NH4-N的超标排放会引起水环境恶化、水体富营养化等严重后果[1-2].近年来,国家出台了愈加严格的污染物排放标准以减少水资源的污染,在《城镇污水处理厂污染物排放标准》(GB18918-2002)中,一级A标准中规定NH4-N的最高排放标准为5mg/L[3],严格的排放标准彰显了国家对水资源的重视.当前,我国污水处理厂主要采用生物脱氮法进行深度脱氮,但该方法过程复杂、反应周期长、易受外界环境的影响,这些不确定因素增加了污水处理过程NH4-N实时检测和控制的难度.
目前,测定氨氮浓度的方法主要有电化学分析法(氨气敏电极法、吹脱电导法等),仪器仪表法(色谱仪、凯氏定氨仪等),分光光度法(纳氏试剂法、靛酚蓝光度法等)等[4],这些方法具有测量误差小、灵敏度高等优势,但检测过程繁琐、时间长、成本高,无法满足污水处理过程NH4-N实时测量的要求.此外,虽然基于电导法的在线监测仪表[5]能够实现出水NH4-N的实时测量,但由于仪器购买、试剂消耗和监测维护的高成本,使多数城市污水处理厂无法负担.因此,利用智能检测、数据挖掘等技术,深入研究污水处理出水NH4-N的智能检测方法仍是目前研究的热点.
软测量方法具有在线检测精度高、运行成本低等特点,被广泛应用于污水处理水质检测过程[5].目前NH4-N软测量建模的方法主要有工艺机理建模、智能建模等方法[5-8].机理建模是通过分析污水处理过程与NH4-N浓度动态变化的参数信息,建立反映出水NH4-N浓度变化的数学模型,并通过易测变量预测NH4-N浓度变化. Chen等[6]通过分析氨氮质量浓度的有关的易测变量,设计氨氮自动检测仪,实现了氨氮的自动检测,但其试剂消耗较大,维护成本较高,推广实施具有较大难度. Luo等[9]运用机理模型实现对NH4-N的预测,避免了昂贵仪器的使用,降低了运行成本.城市污水处理过程复杂,机理模型难以完全表达污水处理动态过程.另一方面,智能建模是通过神经网络等智能建模理论建立软测量模型,其优越的非线性拟合能力、自适应能力能够适应污水处理对出水变量预测的需要[10-11]. Yang等[12]利用误差反传(back propagation,BP)神经网络建立出水NH4-N软测量模型,选择水温、pH和非离子氨浓度三个输入变量,运用梯度法修正模型并预测NH4-N浓度,但BP神经网络难以完全表达污水环境中存在的不确定性因素,预测结果较差,无法准确获取NH4-N浓度的有效值. Deng等[13]基于径向基(radial basis function,RBF)神经网络预测出水NH4-N,由于网络输入辅助变量选取不合理,导致网络运行速度慢,变量间复杂的关系影响了出水NH4-N预测性能,难以满足实际中出水NH4-N检测的精度要求. Ráduly等[14]通过前馈神经网络来预测多个过程变量,选取化学需氧量(chemical oxygen demand,COD)、生物需氧量(biochemical oxygen demand,BOD)、总悬浮物(total suspended solid,TSS)等参数作为输入变量,由于前馈神经网络结构简单,学习能力弱,对出水NH4-N预测存在较大的误差.以上基于神经网络的智能建模方法在进行NH4-N预测时具有各自的优势,但神经网络在训练时结构固定,自适应能力相比于自组织神经网络有所欠缺.因此,如何高效、实时地检测出水NH4-N浓度仍是目前污水处理过程研究的焦点.
为了实现氨氮的在线测量,本文提出了一种基于尖峰自组织径向基神经网络的氨氮软测量方法,该方法的主要创新之处在于:采用尖峰机制和梯度下降算法自适应网络结构和参数,依据输入信息实时更新网络,并将基于SSORBF的自组织软测量方法应用于污水处理实际运行过程,提高了预测精度和自适应能力,达到了高效预测污水处理出水NH4-N浓度的目的.
2 氨氮软测量设计氨氮软测量的设计主要包括:数据采集与预处理、辅助变量选取、软测量模型的建立和出水氨氮预测,其结构如图 1所示.
2.1 数据采集与预处理数据采集是污水处理氨氮软测量建立的重要环节,数据采集的数量与质量很大程度上影响着氨氮预测的效果.同时,由于仪表测量的精度、人工操作的误差、测量方法等原因会引起数据采集的不准确,存在异常数据.所以,在数据预处理阶段需要剔除异常数据并将数据归一化.本文采用北京某污水处理厂存储的历史数据和在线数据进行试验测试,测量采集污水参数为进水总磷(total phosphorus,TP)、温度T、厌氧末端氧化还原电位(oxidation-reduction potential,ORP)、好氧前端溶解氧(dissolved oxygen,DO)、好氧末端DO、好氧末端TSS、出水酸碱度(pH)、出水ORP,污泥龄(sludge retention time,SRT).同时,采用准则剔除异常数据并采用归一化方法消除量纲带来的影响.
2.2 氨氮辅助变量的选取辅助变量的选取是指从已知可测的变量中选取合适的辅助变量作为网络的输入,从而减少氨氮软测量模型的计算量、简化网络输入维数.本文采用主元分析法(principal component analysis,PCA)[15]进行选取,通过抽取主要变化信息,提取统计特征,选取了温度T,好氧前端DO,好氧末端总悬浮物固体TSS,出水酸碱度pH,出水氧化还原电位ORP,污泥龄SRT六个辅助变量作为模型的输入变量.
2.3 软测量模型SSORBF网络的建立本文所采用的自组织RBF软测量模型,主要分为RBF网络自学习和网络结构自组织两个部分,其中RBF神经网络结构如图 2所示.
(1) RBF神经网络
RBF神经网络共分为3层:输入层、隐含层、输出层.
① 输入层
该层含有n个神经元,输入层神经元的输出为
(1) |
其中,ui(t)是第i个输入层节点在t时刻的输出,并且输入向量为x(t)=[x1(t),x2(t),…,xi(t)],i=1,2,…n,t=1,2,…,L.
② 隐含层
该层对输入信息进行处理且传递函数为径向基函数,常选择标准的高斯函数,在t时刻隐含层第j个神经元的输出为
(2) |
其中,cj(t)=[cj1(t),cj2(t),…,cjn(t)]为RBF层第j个神经元的中心向量;cji(t)∈[-2, 2]为随机取值,σj(t)为第j个节点的宽度,j的最大值为m,m为隐含层神经元个数,σj(t)∈[0.01,2],为该范围内的随机值;
③ 输出层
该层只有一个输出节点,在t时刻RBF神经网络的输出为
(3) |
其中,y(t)是输出层在t时刻的输出,wj(t)是隐含层与输出层之间的连接权值;
(2) RBF网络结构自组织机制
神经网络结构对预测性能有着重要影响,当隐含层神经元个数较少时,网络容错性差,预测精度低;当神经元个数过多时,网络计算量大复杂度高,如何设计神经网络隐含层结构仍是研究的热点.
文[16-17]中指出,生物神经元膜电位的变化取决于受到的刺激强度,通过分析其生物机理建立隐含层神经元尖峰强度如下:
(4) |
其中,ssj(t)是隐含层第j个神经元的尖峰强度;k=1;kτ=0.17为常量;θj为式(2)隐含层神经元的输出;ε为大于0的正值,取值为7.
本文借鉴生物神经元膜电位激发机理,采用基于尖峰机制的自组织动态调整网络结构.当隐含层神经元的尖峰强度大于兴奋阈值时,产生类似于“动作电位”的活跃输出,认为该神经元处理能力有限,需要新增加神经元处理任务;若隐含层神经元的尖峰强度小于兴奋阈值,认为该神经元基本处于不工作状态,为了获得更为紧凑的神经网络结构,需要删除该隐含层神经元.因此,RBF神经网络自组织调整阶段具体步骤为:
① 隐含层神经元增加阶段
根据隐含层尖峰强度定义,当神经网络满足:
(5) |
其中,ss0取0~0.5的值,表示隐含层第j(j=1,2,…,m)个神经元的兴奋阈值;Ed是预先设定的训练误差,本文取值0.01.当两个条件同时满足时,第j个隐含层神经元将会分裂同时新的神经元将被加入.
新增加的神经元参数定义为
(6) |
其中,cj(t)、σj(t)为第j个分裂前神经元的中心和宽度,cj-r(t)、σj-r(t)为新增加r(r=1,2,…,Nnew)个神经元的中心和宽度,Nnew为神经元增加过程中计算得到的个数,αr∈[0.95,1.05],βr∈[0,0.1],本文中αr=0.95,βr=0.05,γr=1/Nnew,wj-r(t)为新增加的隐含层神经元r的连接权值,wj(t)分裂前第j神经元的连接权值,Nnew为新增加的神经元的个数,θj-r(t)为新增神经元的隐含层输出值.
② 隐含层神经元删减阶段
当隐含层神经元的尖峰强度满足式(7)的条件时,删除冗余神经元:
(7) |
其中,ssr是隐含层第j(j=1,2,…,m)个神经元的静息电位设定值,取值范围为(0,ss0).
神经元参数设置为
(8) |
其中,j′为与隐含层神经元j欧氏距离最近的隐含层神经元,c′j′(t)、cj′(t)为隐含层神经元j′在神经元j删除后和删除前的中心,σ′j′(t)、σj′(t)为隐含层神经元j′在神经元j删除后和删除前的宽度,w′j′(t)、wj′(t)为神经元删除后和删除前的输出连接权值.
2.4 SSORBF结构设计及参数学习方法定义预测模型输出y(t)与期望输出d(t)之间的误差函数为
(9) |
y(t)为数组y的第t个模型预测输出数据,d(t)为第t个实际期望输出,L为样本个数.
由式(2)、式(3)计算预测输出y(t);采用梯度下降法求得中心cj(t)、宽度σj(t)及权值wj(t)的增量:
(10) |
(11) |
(12) |
其中,隐含层个数j=1,2,…,m,Δcj(t)、Δσj(t)和Δwj(t)分别为模型中心值、宽度和权值的增量.
调整模型的参数:
(13) |
(14) |
(15) |
其中,c′ji(t)、b′j(t)和w′j(t)分别为模型调整前的中心值、宽度和权值;cji(t)、bj(t)和wj(t)分别为模型调整后的中心值、宽度和权值,调整前的参数值由计算所得;λ∈(0,0.1)表示学习率.
3 SSORBF自组织神经网络学习步骤文中提出的SSORBF神经网络结构调整学习的具体步骤为:
Step 1 根据样本信息,建立RBF神经网络,初始化网络参数,输入层输出层个数为样本输入和输出维数.
Step 2 对于输入样本X(t),神经网络中参数权值w、中心c和宽度σ可通过式(13)、式(14)、式(15)确定.
Step 3 根据式(4)计算隐含层的神经元的尖峰强度,若第j个隐含层神经元的尖峰强度ssj大于阈值ss0且同时满足根均方误差大于设定值,则转至Step 4;若第j个神经元的尖峰强度ssj小于阈值ssr,则转至Step 5;否则转至Step 6.
Step 4 分裂第j个隐含层神经元并增加新的神经元,新增加的隐含层神经元参数设定,如式(6)所示.
Step 5 删除隐含层第j个神经元,并根据式(7)更新与神经元j最近的隐含层神经元,完成误差补偿.
Step 6 令t=t+1,转至Step 2;当满足精度要求或达到训练步数则停止.
4 仿真实验与结果本文选取了两个实验验证SSORBF神经网络的有效性.实验1时间序列预测,实验2实际污水处理过程中氨氮预测.采用均方根误差(root mean square error,RMSE)和神经元个数作为性能评价指标.其中,RMSE的计算公式为
(17) |
其中,y(t)为网络输出,d(t)为实际输出,L是样本个数.
4.1 Mack-Glass时间序列Mackey-Glass时变序列是一类经典的实际序列问题,时变序列由下列离散方程产生:
(18) |
其中,a=0.1,b=0.2,τ=17,x(0)=1.2,其预测模型为
(19) |
根据Mackey-Glass模型产生1 000个时间序列,前500个时间序列用于预测,后500个时间序列用于测试.设定SSORBF神经网络隐含层神经元初始数目为4个,期望误差为0.001.对比实验中广义动态模糊神经网络(generalized dynamic fuzzy neural networks,GDFNN)初始网络结构为6-4-1,广义增长减枝径向量神经网络(generalized growing and pruning RBF,GGAP-RBF)初始网络结构为6-4-1,RBF固定网络结构为6-10-1,网络期望误差为0.001,参数学习率为0.001,迭代次数为500步,网络模型的预测输出结果如图 3、图 4所示.
图 3为实际输出与SSORBF网络输出对比图,图 4为测试样本误差.对比图 3中实际输出和预测输出值,可以看出SSORBF网络能够准确预测输出值,与实际输出相吻合.从图 4中可以看出,SSORBF网络测试样本与实际值的误差区间为[-0.04,0.04],误差波动范围较小,具有较高的预测精度.
图 5为神经网络训练过程隐含层神经元结构调整图.在训练初期隐含层神经元快速增加以减少网络结构过小带来的训练误差,在网络调整中期,神经网络结构随着输入信息的改变调整网络结构,并在训练后期趋于稳定.
表 1为4种不同神经网络模型性能对比.通过将SSORBF网络的训练结果与GDFNN[18]和GGAP-RBF[19]网络对比可以发现,在网络自调整过程中,SSORBF网络的训练RMSE和测试RMSE均小于其它网络,表现出更好的预测精度,同时,SSORBF神经网络隐含层神经元个数小于上述网络.其次,将SSORBF网络与固定结构的RBF[13]网络预测效果对比发现,本文所提神经网络可以依据激活强度大小调整网络结构,相比固定结构RBF网络具有更好的预测性能和更精简的网络结构.
为了检测本文所提出的SSORBF氨氮软测量的有效性,采用北京某污水处理厂实际测量数据进行建模预测.实验之前需要对采集额数据进行预处理,剔除异常数据并将数据归一化处理,得到190组数据样本,选取140组数据作为训练样本,50组作为测试样本.实验选取的6个输入变量为:出水ORP、好氧前端DO、好氧末端TSS、出水pH、温度T、SRT,网络输出变量为出水氨氮.通过训练测试进行的方式,验证实验的有效性.本实验中设置SSORBF神经网络隐含层神经元初始数目为4个,期望误差为0.1.对比实验中GRRBF网络结构为6-10-1,RBF网络结构为6-9-1,BP的结构为6-10-1,网络期望误差为0.1,参数学习率为0.001 5,迭代次数为500步,网络模型的训练和预测输出结果如图 6和图 7所示.
图 6和图 7分别为实际输出与不同网络训练输出和预测输出对比图.从图 6可知,SSORBF网络相比于BP网络和RBF网络,可以较为准确地跟踪学习训练样本,减少学习过程中的误差波动,基本拟合实际输出曲线;而BP和RBF网络学习能力较弱,不能够很好地学习训练样本,误差较大.对比图 7中的曲线可知,SSORBF网络的模型预测误差较小,可以准确预测氨氮浓度,基本拟合氨氮预测输出曲线.
图 8为训练RMSE曲线图和训练过程隐含层神经元结构调整图.由图 8(a)可知,当预测氨氮浓度时,SSORBF网络训练RMSE随着训练步数快速下降,可以精确地学习训练样本.同时,通过对比图 8(b)发现在训练初期网络结构随着输入信息的改变进行调整,波动较快;在网络学习的中期,采用尖峰机制对隐含层神经元进行删减合并,在训练后期网络结构趋于稳定,达到较高的精度.
表 2为不同神经网络模型氨氮预测性能比较.从表 2可以看出,本文提出的SSORBF神经网络的训练RMSE和测试RMSE相比于GRRBF[20]、BP[12]、RBF[13]网络为最小值.在取得较高精度的同时,能够删除冗余神经元,调整网络结构,达到较好的预测精度.
为了解决污水处理过程中氨氮实时测量难、周期长的问题,本文提出了一种基于尖峰自组织径向基神经网络的氨氮软测量方法,通过仿真实验,得到了良好的预测效果,具体结论为
1) 尖峰自组织机制是通过模拟生物神经元膜电位的变化,分析被激活隐含层神经元的活跃度判别网络的增减状况,调整网络结构,增加网络的自适应能力.
2) 基于自组织径向基神经网络的预测方法采用梯度下降算法调整网络参数,训练和测试误差小,具有较好的预测精度.
3) 基于自组织径向基神经网络的软测量方法在污水处理氨氮在线测量方面具有较强的潜力,为出水氨氮预测提供了一种行之有效的方法,也为变量预测、网络结构调整提供了很好的借鉴作用.
从长远角度来看,要实现污水处理行业的又好又快发展,完成水资源出水指标的智能在线检测,后续研究应在如何探索利用对出水指标影响较大的隐性变量;如何建立基于机理、数据和知识的混合预测模型;如何实现预测模型结构参数动态优化等方面深入探讨.
[1] | Amini M, Younesi H, Lorestani A A Z, et al. Determination of optimum conditions for dairy wastewater treatment in UAASB reactor for removal of nutrients[J]. Bioresource Technology, 2013, 145(10): 71–79. |
[2] | Strokal M, Yang H, Zhang Y, et al. Increasing eutrophication in the coastal seas of China from 1970 to 2050[J]. Marine Pollution Bulletin, 2014, 85(1): 123–140. DOI:10.1016/j.marpolbul.2014.06.011 |
[3] | Du R, Peng Y Z, Cao S, et al. Advanced nitrogen removal from wastewater by combining anammox with partial denitrification[J]. Bioresource Technology, 2015(179): 497–504. |
[4] |
王文萍, 郭周芳, 尚伟伟, 等.
水中氨氮的测定方法[J]. 水科学与工程技术, 2012, 3: 26–28.
Wang W P, Guo Z F, Shang W W, et al. Determination methods summary of ammonia nitrogen in water[J]. Water Sciences and Engineering Technology, 2012, 3: 26–28. |
[5] | De Canete J F, Del S P, Baratti R, et al. A soft-sensing estimation of plant effluent concentrations in a biological wastewater treatment plant using an optimal neural network[J]. Expert Systems with Applications, 2016, 63: 8–19. DOI:10.1016/j.eswa.2016.06.028 |
[6] |
陈静, 徐滋秋, 付万年, 等.
电导法氨氮自动连续监测仪的设计与研究[J]. 仪表技术, 2010, 12: 39–41.
Chen J, Xu Z Q, Fu W N, et al. Design and study on conductometry ammonia on-line and continuous monitoring detector[J]. Instrumentation Technology, 2010, 12: 39–41. |
[7] | Qiu Y, Liu Y, Huang D. Date-driven soft-Sensor design for biological wastewater treatment using deep neural networks and genetic algorithms[J]. Journal of Chemical Engineering of Japan, 2016, 49(10): 925–936. DOI:10.1252/jcej.16we016 |
[8] | Haimi H, Mulas M, Corona F, et al. Data-derived soft-sensors for biological wastewater treatment plants:An overview[J]. Environmental Modelling and Software, 2013, 47: 88–107. DOI:10.1016/j.envsoft.2013.05.009 |
[9] | Luo S. Comparison between four automatic on-line monitoring instrument and laboratorial national standard method to determine ammonia-nitrogen in water[J]. Environmental Monitoring in China, 2010, 26(3): 32–35. |
[10] | Hanbay D, Turkoglu I, Demir Y. Prediction of chemical oxygen demand (COD) based on wavelet decomposition and neural networks[J]. Clean-Soil Air Water, 2007, 35(3): 250–254. DOI:10.1002/(ISSN)1863-0650 |
[11] | Choi D J, Park H. A hybrid artificial neural network as a software sensor for optimal control of a wastewater treatment process[J]. Water Research, 2001, 35(16): 3959–3967. DOI:10.1016/S0043-1354(01)00134-8 |
[12] |
杨琴, 谢淑云.
BP神经网络在洞庭湖氨氮预测中的应用[J]. 水资源与水工程学报, 2006, 17(12): 65–67.
Yang Q, Xie S Y. Application of BP neural network into predicting NH3-N concentration of dong ting lake[J]. Journal of Water Resources and Water Engineering, 2006, 17(12): 65–67. |
[13] | Deng C, Kong D, Song Y, et al. A soft-sensing approach to on-line predicting ammonia-nitrogen based on RBF neural networks[C]//Second International Conference on Embedded Software and Systems. Piscataway, NJ, USA:IEEE, 2009:454-458. http://ieeexplore.ieee.org/document/5066683/ |
[14] | Ráduly B, Gernaey K V, Capodaglio A G, et al. Artificial neural networks for rapid WWTP performance evaluation:Methodology and case study[J]. Environmental Modelling & Software, 2007, 22(8): 1208–1216. |
[15] | Morchid M, Dufour R, Bousquet P M, et al. Feature selection using principal component analysis for massive retweet detection[J]. Pattern Recognition Letters, 2014, 49: 33–39. DOI:10.1016/j.patrec.2014.05.020 |
[16] | Bachtiar L R, Unsworth C P, Newcomb R D, et al. Multilayer perceptron classification of unknown volatile chemicals from the firing rates of insect olfactory sensory neurons and its application to biosensor design[J]. Neural computation, 2013, 25(1): 259–287. DOI:10.1162/NECO_a_00386 |
[17] | Han H G, Wang L D, Qiao J F, et al. A spiking-based mechanism for self-organizing RBF neural networks[C]//International Joint Conference on Neural Networks. Piscataway, NJ, USA:IEEE, 2014:3775-3782. http://ieeexplore.ieee.org/document/6889473/ |
[18] | Wu S Q, Er M J, and Gao Y. A fast approach for automatic generation of fuzzy rules by generalized dynamic fuzzy neural networks[J]. IEEE Transaction on Fuzzy Systems, 2001, 9(4): 578–594. DOI:10.1109/91.940970 |
[19] | Li S Y, Chen Q, Huang G B. Dynamic temperature modeling of continuous annealing furnace using GGAP-RBF neural network[J]. Neurocomputing, 2006, 69(4/5/6): 523–536. |
[20] |
乔俊飞, 安茹, 韩红桂.
基于RBF神经网络的出水氨氮预测研究[J]. 控制工程, 2016, 23(9): 1301–1305.
Qiao J F, An R, Han H G. Water ammonia nitrogen prediction research based on RBF neural network[J]. Control Engineering of China, 2016, 23(9): 1301–1305. |