基于ADHDP的热源供热优化控制

文章快速检索

引用本文

李琦, 武旭丹. 基于ADHDP的热源供热优化控制[J]. 信息与控制, 2017, 46(5): 627-633, 640. 复制到剪切板

LI Qi, WU Xudan. Optimizing Control of Heating Based on Action-dependent Heuristic Dynamic Programming[J]. Information and Control, 2017, 46(5): 627-633, 640. 复制到剪切板

基于ADHDP的热源供热优化控制

李琦, 武旭丹

内蒙古科技大学信息工程学院, 内蒙古包头 014000

收稿/录用/修回: 2016-08-15/2016-10-14/2016-11-01

基金项目: 国家自然科学基金资助项目（61463040）

作者简介: 李琦（1973-），男，硕士，教授.研究领域为智能优化控制和工业远程控制.
武旭丹（1992-），女，硕士生.研究领域为控制算法.

通信作者: 武旭丹，407196917@qq.com

摘要: 城市集中供热控制系统优化控制的目标是在按需供热的前提下做到高效节能、减排环保，而集中供热系统是一个有着非线性、大滞后和强耦合等特点的多输入多输出系统，采用经典控制理论难以达到理想的控制效果.供热系统的运行调节是影响供热系统能耗的主要因素之一，本文以供热系统中的热源热量生产优化问题为主要研究内容，提出一种基于执行依赖启发式动态规划（ADHDP）算法的热源总供热量优化控制方法，在满足热用户供热需求的前提下，以系统总能耗为目标函数，求解获得热源出口优化供水温度和供水流量设定值.编写Matlab程序进行了仿真实验，实验结果表明了该方法的有效性，具有显著的节能效果.

关键词: 集中供热动态规划执行依赖启发式动态规划优化控制

Optimizing Control of Heating Based on Action-dependent Heuristic Dynamic Programming

LI Qi, WU Xudan

College of Information Engineering, University of Science and Technology of Inner Mongol, Baotou 014000, China

Abstract: The optimal control goals of urban district heating control systems are to meet heating demand while achieving high energy saving, emission reduction, and environmental protection under the premise of on-demand heating. The district heating system is a multi-input, multi-output system with nonlinearity, large time-delay, and strong coupling. Thus, achieving an ideal control effect using the classical control theory is difficult. The operation adjustment of the heating system is one of the main factors that influence energy consumption. Thus, this study mainly focuses on the heat source-heat production optimization problem of the district heating system. This study proposes a heat source-total heat supply optimizing control method based on the action-dependent heuristic dynamic programming (ADHDP) algorithm. This method takes the total energy consumption of the heating production system as the optimal objective function to meet the demand of heat consumers. The minimum value of the objective function is solved, and the optimization set point of heat source outlet water temperature and water flow is obtained. The effectiveness of the method is proven by simulation experiments implemented with the MATLAB language; the method has a remarkable energy saving effect.

Key words: district heating dynamic programming action-dependent heuristic dynamic programming (ADHDP) optimal control

1 引言

城市集中供热系统在北方城市中的应用愈发广泛，相应的供暖能耗也在不断提高^[1]，国务院办公厅于2011年8月31日印发《“十二五”节能减排综合性工作方案》^[2]，以节能减排为总体要求和主要目标，“十三五”时又提出更高的目标.而北方城市供暖能耗占我国城镇建筑运行能耗总量的40%左右^[3-5]，如何有效降低北方采暖能耗，是我国建筑节能工作的重点. 20世纪70年代末、80年代初改革开放以来，大力推动热电联产供热发展，综合效率提高25%左右^[6^]，但目前我国的控制方式仍不完善，存在着供需不匹配、大流量小温差、水力工况失调等多种问题，导致满足不了用户需求及能源浪费的情况^[7].中国工程院院士、清华大学教授江亿表示，尽力提高热源效率，降低单位热量煤耗能够有效降低北方城镇供暖能耗^[8].

集中供热控制系统运行调节有3种基本方式，分别是全局调节、局部调节和用户调节.主要调节方法有质调节、量调节、间歇调节、质量并调等多种方式^[9].目前供热系统的主要控制问题就是热源热量的按需生产、热力站热量的按需分配及二次管网的优化控制.近年来已有诸多学者针对集中供热系统的运行调节进行了相关研究.王庆峰采用质量并调的调节方式，以运行能耗费用最低为优化目标，使用非线性规划方法求解方程^[10]；介鹏飞以热量输送过程的运行费用及热源运行费用最小化为目标函数，在Matlab中对方程进行求解^[11].杜平以量调节为初调节的方式综合考虑水利稳定性对供热系统的影响进行了研究^[12].

集中供热系统的复杂性使得优化控制出现了“维数灾”问题，而由Werbos教授提出的自适应动态规划，用近似的方法求解动态规划以克服“维数灾”问题^[13]，后又提出执行依赖的形式，具有更高的控制精度和更好的控制效果.本文主要对热源产热量的合理化进行研究，故采用ADHDP算法对热源处进行全局调节，采用质量并调的方式，同时调节循环水温度及流量，以热源处供热能耗最小化为目标，对热源处的供热量进行优化控制.

2 基于ADHDP的热源优化控制总体方案

城市集中供热控制系统由热源、换热站、管网及热用户四大部分组成，热能以热水或热蒸汽为媒介沿着管网传输，热水通过一次网到达各热力站，并通过热交换器转换将热能分配给二次网，再由二次网传递给热用户，这就是热能的传输过程^[14].在热能的传输过程中，需要综合考虑热用户的供热需求，对热源的控制力争做到按需供热.集中供热控制系统的运行调节和优化控制包括两个方面，一是供热系统总热量的生产问题；二是热源热量到各个热力站的输配问题.即在一次网能够提供充足热量的情况下，通过控制热力站对总热量进行合理分配，从而达到均匀供热的目的.本文的研究目的为优化热源热量的生产问题，就是根据热负荷的变化生产和输出热量，保证热量的生产量足够热用户需求并且节约能源，具体为热源流量和供水温度的设定值优化问题.供热系统总体框图如图 1所示.

图 1 供热系统总体框图 Figure 1 Heating system overall block diagram

图选项

集中供热系统中的供热需求随着天气情况(如温度、湿度、风力等)及热用户情况实时变化，因此热源的产热量也要随之变化.同时，在大规模集中供热系统中，供热面积大、供热管网距离长，调节效果显现延时较大，造成了热源具有非线性、随动性和大滞后等特点.热源的优化控制是一个复杂的控制问题，采用经典控制理论和现代控制理论很难在保证供热质量的前提下，实现节能、减排的控制目标.

为避免动态规划的“维数灾”问题，自适应动态规划(ADP)应运而生，它融合了人工智能和控制学科两大领域的先进思想，用于解决大规模复杂非线性系统优化控制问题的方法. 1992年Werbos教授提出在ADP中采用前向动态规划算法，即执行依赖启发式动态规划(ADHDP).其执行网络的输出增加为评价网络的部分输入，因而比启发式动态规划(HDP)具有更高的控制精度.集中供热系统多输入多输出的复杂性导致其难以建立准确的数学模型，而执行依赖启发式动态规划(ADHDP)无需模型网络，不需要精确的集中供热系统数学模型，以BP神经网络实现即可.也无需精准定义系统的性能指标函数，只需通过与被控对象的信息交互在线学习即可优化控制，故而适用于集中供热系统的热源供热优化控制.

热源产热量的合理化控制取决于两方面，一是热负荷预测的准确性；二是控制量的最优性.本文主要侧重于对控制量最优性的研究，应用执行依赖启发式动态规划算法^[15]对热量生产进行优化控制. ADHDP^[16]工作原理与HDP(启发式动态规划)^[17]基本相同，其最大的区别在于ADHDP的评价网络不但以系统状态作为输入，同时也以控制量作为输入.结构示意图如图 2所示.

图 2 ADHDP结构示意图 Figure 2 ADHDP structure diagram

图选项

集中供热系统的优化控制问题最终要以循环泵的频率及电磁阀的开度为最终控制量.在ADHDP中以控制供水流量和供水温度的形式进行优化，x(k)为状态量，即当前时刻的回水温度，u(k)为控制量，即当前时刻的供水温度和供水流量.将状态量输入执行网络，得到控制量，与状态量一同输入被控对象，得到下一时刻的状态量.当前时刻和下一时刻的控制量和状态量分别输入评价网络，得出当前时刻和下一时刻的代价函数，两个时刻的代价函数与效用函数形成误差，通过最小化误差来实现供热系统的优化控制.

3 基于BP神经网络的热网被控对象建模

铝厂发电进行电解铝后产生的高温高压蒸汽传输到汽水换热器，释放热量后液化为低温冷凝水回到铝厂；汽水换热器中的热媒水在换热器中获得热量后生成首站供水，对一次网进行供热，供热结束后由回水泵将首站回水抽回，进行二次热交换.热量生产的模型如图 1供热系统总体框图中热源部分所示.

3.1 样本数据

本实验所用数据由中国天气网和包头市某热力公司旗下包头铝厂热源提供，并以该热源为研究对象，保证实验的准确性及可实施性.

被控对象模型选取了该热源2015年12月的数据，采样时间间隔为1 h.共选取了513组供水流量、供水温度及回水温度数据对，以当前时刻的供水流量、供水温度和回水温度作为输入量，下一时刻的回水温度为输出量.随机选取500组作为训练数据集，80组作为测试数据集.训练样本部分数据如表 1所示.

表 1 样本数据 Table 1 Sample data

序号	回水温度/℃	供水温度/℃	供水流量/(t/h)
1	58.01	84.47	1386.53
2	57.90	84.35	1387.87
3	58.01	84.53	1382.12
4	58.03	84.69	1378.33
5	57.92	84.70	1383.08
6	57.90	84.55	1387.13
			
510	58.14	84.28	1386.03
511	58.31	87.73	1388.10
512	58.31	88.31	1394.28
513	58.01	84.47	1386.53

表选项

3.2 被控对象建模

采用BP神经网络对供热系统热源被控对象进行建模^[18].热源处下一阶段的回水温度(状态量)由当前阶段的供水温度、供水流量(控制量)和回水温度(状态量)决定.当热源的供水温度和供水流量变化时，热源所提供的总热量会随之变化，回水端的温度也会发生变动.因此，将当前阶段的供水温度、供水流量和回水温度作为模型网络的输入，将下一阶段的回水温度作为模型网络的输出.建立一个3输入1输出的神经网络模型，如图 3所示.

图 3 基于BP网络的热源模型 Figure 3 The heat source model based on BP network

图选项

集中供热系统模型网络采用2-5-1结构，双隐含层，学习率为0.1，最大训练次数为100次，训练误差为0.004.供热系统模型的泛化能力如图 4所示，能较好地拟合，可以体现实际供热现场的数据变化趋势.

图 4 集中供热系统模型泛化能力测试 Figure 4 The district heating system model generalization ability test

图选项

4 基于ADHDP的热源供热量控制器设计

集中供热ADHDP控制系统，包括效用函数的定义、评价网络、执行网络及参数的选取等几个重要部分.

4.1 热负荷预测

供暖热负荷设定值通过结合当天气温(由中国天气网提供，见表 2)和历史供暖数据(由第3小节中热源提供)，训练Elman神经网络，建立了热负荷预测模型，得出符合实际供暖需求的热负荷，见表 3.热负荷预测值用于效用函数中总热量生产值的设定，即效用函数式(7) 中的Q，由Elman神经网络预测所得.

表 2 包头2015年12月28日天气温度 Table 2 The weather temperature in Baotou on December 28, 2015

时间点	气温/℃
0	-11
1	-11
2	-11
3	-13
4	-13
5	-14
6	-14
7	-14
	
21	-8
22	-9
23	-10

表选项

表 3 Elman神经网络热负荷预测值 Table 3 Heat load forecast based on Elman neural network

时间点	热负荷/GJ
0	165.13
1	165.51
2	165.30
3	166.10
4	164.93
5	163.66
6	164.91
7	160.47
	
21	146.88
22	146.22
23	146.72

表选项

4.2 效用函数

自适应动态规划的思想是先通过某种函数近似最优性能指标，然后再通过一个近似工具实现对最优控制序列的选择.效用函数U(t)反映每一步的控制效果及被控系统各方面的要求，用来近似性能指标.性能指标(代价)函数如式(1) 所示.本文中的效用函数是对资源的消耗，如式(7) 所示，优化目标是在满足供热量的约束条件下性能指标函数最小化.

(1)

热源运行能耗大致等效为两大部分，一是热电联产的煤耗部分，二是循环水泵的电耗部分，如式(2) 所示，

(2)

在供热管网运行稳定的状态下，若不考虑管网沿途热损失，管网的供热量等于热用户端的散热量，等于热源处的产热量，同时也等于供暖热用户的热负荷.即式(3) 所示热平衡方程式：

(3)

将热平衡公式进行联立，求得热源首端供水流量的代表式：

(4)

计算产出所需热负荷应消耗的煤量：

(5)

循环水泵的耗电量计算式如式(6) 所示：

(6)

将式(4)~(6) 代入式(2)，得最终能耗公式：

(7)

约束条件的选取基于2015年11月至2016年4月采暖期，统计了这一采暖期的全部供回水温度及供水流量数据，剔除不合理数据后得到约束条件如式(8) 所示：

(8)

以上公式中所涉及到的符号均在表 4中备注.

表 4 符号表 Table 4 The symbol table

序号	符号	意义	单位
1	Q	热水网路输送给供暖热用户的热量(热负荷预测值)	GJ
2	c	热水的质量比热容c=4.187	kJ/(kg·℃)
3	G₁	供暖用户的循环水流量	t/h
4	t_g	供水温度	℃
5	t_h	回水温度	℃
6	Q₁	供暖热用户的热负荷	W
7	Q₂	热用户端的散热量	W
8	Q₃	管网的供热量	W
9	Q₄	热源处的产热量	W
10	A₁	散热器面积	m²
11	q_f	为建筑物的面积供暖热指标(其中已包含约5%的管网热损失)	W/m²
12	K	换热器传热系数	kW/(m²·℃)
13	A₂	建筑物的供暖建筑面积	m²
14	Δt		℃
15	G₂	热源首端供水流量	t/h
16	h	供热蒸汽焓值	kJ/kg
17	t′_h	冷凝水温度	℃
18	t′_g	供热蒸汽温度	℃
19	ΔQ^*	蒸汽的冷凝潜热值	kJ/kg
20	η₁	散热器效率
21	h_b	蒸汽焓值	kJ/kg
22	h_g	锅炉给水焓值	kJ/kg
23	η_b	锅炉效率
24	η_p	管道效率
25	η_h	热网效率
26	s	管网的阻力特性系数
27	η₂	循环水泵效率
28	ρ	循环水密度	983.2 kg/m²
29	g	重力加速度	m/s
30	l_c	评价网络学习率 l_c(0 < l_c < 1)
31	l_a	执行网络学习率l_a(0 < l_a < 1)
32	γ	折扣因子γ(0 < γ≤1)

表选项

4.3 评价网络

评价网络采用具有2+1个输入神经元，1个隐藏层神经元和1个输出神经元的结构. 3个输入分别是系统在k阶段的状态向量x(k)即k时刻的回水温度，以及执行网络对状态x(k)的预测控制向量u₁(k)和u₂(k)，即k时刻的供水温度及供水流量.输出是对最优性能指标的估计.评价网络和执行网络的隐藏层均采用双极性Sigmoidal函数，输出层则都采用线性函数Purelin^[21].

评价网络的训练过程分为两部分，正向的计算过程和更新评价网络权值矩阵误差的反向传播过程.

定义评价网络k阶段的输入向量为C_input(k)，C_input(k)=[u₁(k)，u₂(k)，x(k)].

1) 评价网络的正向计算过程如式(9) 所示：

(9)

式中，c_h1j(k)是评价网络隐藏层第j个节点的输入；c_h2j(k)是评价网络隐藏层第j个节点的输出.

评价网络的训练采用梯度下降法，通过最小化式(10) 定义的误差来实现.

(10)

2) 评价网络的权值更新过程的推导过程不在此赘述，更新过程如式(11)、式(12) 所示.

① W_c2(隐藏层到输出层的权值矩阵)

(11)

② W_c1(输入层到隐藏层的权值矩阵)

(12)

4.4 执行网络

执行网络采用1-1-2结构. 1个输入是系统在k时刻的状态向量x(k)，2个输出是与输入状态x(k)对应的控制向量u₁(k)和u₂(k).

执行网络的训练过程同样分为两部分，正向的计算过程和更新执行网络权值矩阵误差的反向传播过程.

1) 执行网络的正向计算过程为

(13)

式中，a_h1j(k)是执行网络隐藏层第j个节点的输入；a_h2j(k)是执行网络隐藏层第j个节点的输出.

执行网络的训练以最小化为目标，训练仍采用梯度下降法.

2) 执行网络的权值更新过程的推导过程不在此赘述，更新过程如式(14)、式(15) 所示.

① W_a2(隐藏层到输出层的权值矩阵)

(14)

其中，W_c1u=W_c1(1:m，:)，W_c1(1:m，:)是Matlab中常用的矩阵表示形式，表示矩阵W_c1的前m行，即与控制量对应的部分权值.

② W_a1(输入层到隐藏层的权值矩阵)

(15)

4.5 参数的选择及ADHDP训练策略

在ADHDP中，相关参数包括两个网络的隐藏层节点数、学习率以及折扣因子.隐含层节点数通常都是根据实验试凑，从较少的节点数开始，逐步增加，用同一训练样本，观察网络误差最小时的节点数^[22]. 学习率l(0 < l < 1) 越大，其学习速度越快，但会引起震荡，反之又速度太慢，耗时太久，因此通常学习率随着时间从一个较大的初始值慢慢减小，在加快训练速度的同时减少震荡.代价函数J的定义：，是所有未来阶段的U(·)值的总和乘以折扣因子γ(0 < γ≤1)，再加上当前阶段的U(k)的值.对于ADHDP结构，评价网络直接估计J函数的值，适当选择γ对于评价网络的收敛至关重要.一般来说折扣因子越小实验越容易成功，折扣因子越大控制效果越好，通常先从较低值的γ开始训练，然后逐步增大，经多次实验后将折扣因子设为γ=0.9.

ADHDP训练策略如下：

Step 1 确定执行网络及评价网络的结构，每层的节点数，传递函数类型等相关参数.

Step 2 建立铝厂热源的模型作为被控对象.

Step 3 初始化各个网络的权值，定义神经网络折扣因子γ及学习率l的值.

Step 4 设定供热系统的初始状态量x(k)，并将其输入到执行网络，得到当前阶段的控制量u(k).

Step 5 将当前阶段的状态量x(k)和当前阶段的控制量u(k)输入到被控对象中，得到下一阶段的状态量x(k+1).

Step 6 将下一阶段的状态量x(k+1) 和下一阶段的控制量u(k+1) 作为评价网络的输入，得到下一阶段性能指标函数的估计值

Step 7 计算执行网络的误差e_a(k)，然后进行调整更新，并训练执行网络.

Step 8 计算评价网络的误差e_c(k)，然后进行调整更新，并训练评价网络.

Step 9 一次训练完成后返回Step 4，直到达到设置的最大循环次数，整个系统训练结束.

ADHDP控制仿真系统算法流程图如图 5所示.

图 5 ADHDP算法训练流程图 Figure 5 The training flow chart of ADHDP algorithm

图选项

5 实验结果

将第3小节中铝厂热源2015年12月28日6时实际供暖数据作为实验数据，状态量回水温度x(k)设为58.9 ℃，并将第3小节中的模型作为ADHDP算法的被控对象，在Matlab中编程，实现以ADHDP算法对集中供热系统热源总供热量优化控制，求出该时刻最小能耗的状态量供水温度u₁(k)和供水流量u₂(k).仿真结果如图 6~图 8所示.

图 6 ADHDP求解热源优化供水温度值的迭代过程 Figure 6 The iterative process of solving water supply temperature optimization of heat source with ADHDP

图选项

图 7 ADHDP求解热源优化供水流量值的迭代过程 Figure 7 The iterative process of solving water supply valueoptimization of heat sourcewith ADHDP

图选项

图 8 ADHDP算法迭代过程中回水温度变化曲线 Figure 8 The temperature change curve of backwater in ADHDP algorithm iterative process

图选项

从仿真图中可以看出，大约30个时间步左右，各个变化曲线趋于稳定，且每个控制量都在合理的范围内变化.其中回水温度的稳定值为59.3 ℃，供水温度的稳定值为86.2 ℃，供水流量值稳定值为1 476 t/h，将供回水温度及供水流量值代入式(7)，可得当前时刻的最小能耗费用为4 498.7元，再通过式(1) 计算可得本文所参照供热系统的热源最优供热量为166.2 GJ，与表 3中热负荷预测值相比相对误差为0.78%.与人工经验调节方式相对比如表 5所示.

表 5 结果对比 Table 5 Comparison of results

对比项目	回水温度/℃	供水温度/℃	供水流量/(t/h)	热负荷/GJ	能耗/元
人工经验	59.8	85.9	1 565	171	4 569.6
ADHDP优化	59.3	86.2	1 476	166.2	4 498.7

表选项

人工经验调节方式与表 3中热负荷值预测值相比相对误差为3.69%，且ADHDP优化控制器比人工经验调节在该时刻节省1.6%.

6 结论

在BP神经网络建模的基础上利用执行依赖启发式动态规划算法，设计了ADHDP优化控制器，采用实际数据对其进行仿真实验，结果表明，ADHDP算法有着较强的优化控制能力，速度快、效果好，理论上达到了集中供热系统热源产热量的优化控制目的，实现了在按需供热的同时将能耗降低，对环保及经济问题都有着较大的意义，也为下一步连续控制优化建立了基础.

参考文献

[1]	徐中堂. 六十年发展中的城市集中供热[J]. 区域供热, 2010(2): 1–10. Xu Z T. The development of urban district heating in sixty years[J]. District Heating, 2010(2): 1–10.

[2]	国家发改委. 《"十二五"节能减排综合性工作方案》解读[J]. 建设科技, 2011(11): 12–15. National Development and Reform Commission. The interpretation of the comprehensive energy saving and emission reduction work plan in "Twelfth five-year"[J]. Construction Science and Technology, 2011(11): 12–15.

[3]	江亿. 北方采暖地区既有建筑节能改造问题研究[J]. 中国能源, 2011(9): 6–13, 35. Jiang Y. Research on transformation of energy-efficient building in the northern heating areas[J]. China Energy, 2011(9): 6–13, 35.

[4]	江亿. 中国建筑能耗现状及节能途径分析[J]. 新建筑, 2008(2): 4–7. Jiang Y. Analysis energy consumption status and energy saving way of china building[J]. New Building, 2008(2): 4–7.

[5]	廖春晖. 燃煤热电联产区域供热系统热源优化配置研究[D]. 哈尔滨: 哈尔滨工业大学, 2014. Liao C H. Research on heating sources combination optimization of district heating systems with combined heat and power plants[D]. Harbin:Harbin Institute of Technology, 2014. http://d.wanfangdata.com.cn/Thesis/D594107

[6]	康艳兵, 张建国, 张扬. 我国热电联产集中供热的发展现状、问题与建议[J]. 中国能源, 2008(10): 8–13. Kang Y B, Zhang J G, Zhang Y. The development situation, problems and suggestions of cogeneration district heating in our country[J]. China Energy, 2008(10): 8–13. DOI:10.3969/j.issn.1003-2355.2008.10.003

[7]	王春玲. 集中供热的现状及发展趋势[J]. 林业科技情报, 2012(3): 43–45. Wang C L. Actually and development tendency of central heating-supply[J]. The Intelligence of Science and Technology of Forestry, 2012(3): 43–45.

[8]	陈向国, 江亿. 推进建筑节能工作得从能耗总量控制抓起[J]. 节能与环保, 2014(7): 20–26. Chen X G, Jiang Y. Promoting building energy efficiency need to grabbed from the control of energy consumption amount[J]. Energy Conservation & Environmental Protection, 2014(7): 20–26.

[9]	段和国. 集中供热系统的供热调节[J]. 山西建筑, 2010, 12(36): 190–192. Duan H G. Heat supply regulation of central heating system[J]. Shanxi Architect, 2010, 12(36): 190–192. DOI:10.3969/j.issn.1009-6825.2010.36.119

[10]	王庆峰. 集中供热系统运行调节优化及热负荷预测方法研究[D]. 济南: 山东大学, 2010. Wang Q F. Research on heat load forecasting and optimization of operation and regulation of district heating system[D]. Jinan:Shandong University, 2010. http://mall.cnki.net/magazine/Article/MYKJ201507004.htm

[11]	介鹏飞. 集中供暖系统热负荷预测及运行优化[D]. 天津: 天津大学, 2013. Jie P F. Heating load prediction and operation optimization of district heating systems[D]. Tianjin:Tianjing University, 2013. http://mall.cnki.net/magazine/Article/MYKJ201507004.htm

[12]	杜平, 陈雪莲. 集中供热管网系统的运行和调节[J]. 宁夏工程技术, 2008(4): 300–302, 306. Du P, Chen X L. Operation and regulation of the district heating pipe network system[J]. Ningxia Engineering Technology, 2008(4): 300–302, 306.

[13]	Werbos P J. Advanced forecasting methods for Global crisis warning and models of intelligence[J]. General Systems Yearbook, 1997(22): 25–38.

[14]	李丽. 集中供热系统的研究与优化[D]. 河北: 华北电力大学(河北), 2009. Li L. Research and optimization of central heating system[D]. Hebei:North China Electric Power University(Hebei province), 2009. http://www.doc88.com/p-972197224634.html

[15]	Werbos P J. Approximate dynamic programming for real-time control and neural modeling[M]. New York, USA: Van Nostrand Reinhold Company, 1992: 493-525.

[16]	Lin X F, Kei S Y, Song C N, et al. ADHDP for the pH value control in the clarifying process of sugar cane juice[C]//5th International Symposium on neural Networks. Beijing:ISNN, 2008:196-805.

[17]	Enns R, Si J. Apache helicopter stabilization using neural dynamic programming[J]. AIAI Journal of Guidance, Control, Dynamic, 2002, 25(1): 19–25. DOI:10.2514/2.4870

[18]	王小川, 史峰, 郁磊, 等. MATLAB神经网络43个案例分析[M]. 北京: 北京航空航天大学出版社, 2013: 196-200. Wang X C, Shi F, Yu L, et al. 43 Cases of MATLAB neural network[M]. Beijing: Beijing University of Aeronautics and Astronautics Press, 2013: 196-200.

[19]	路广遥, 王经, 孙中宁. 换热器热力学计算中平均温差计算方法[J]. 核动力工程, 2008(1): 76–80. Lu G Y, Wang J, Sun Z N. Investigation on calculation method of mean temperature difference in heat exchanger thermodynamic calculation[J]. Nuclear Power Engineering, 2008(1): 76–80.

[20]	刘义章. 对数平均温差中试差法计算[J]. 鸡西大学学报, 2012(5): 137–138. Liu Y Z. LMTD in the trial and method[J]. Journal of Jixi University, 2012(5): 137–138.

[21]	林晓峰, 宋绍剑, 宋春宁. 基于自适应动态规划的智能优化控制[M]. 北京: 科学出版社, 2013. Lin X F, Song S J, Song C N. The intelligent optimization control based on adaptive dynamic programming[M]. Beijing: Science Press, 2013.

[22]	Liu D X, Zhang Y. Action-dependent adaptive critic designs[C]//Proceedings of the INNS-IEEE International Joint Conference on Neural Networks. Piscataway, NJ, USA:IEEE, 2001:990-995.

http://dx.doi.org/10.13976/j.cnki.xk.2017.0627
中国科学院主管，中国科学院沈阳自动化研究所、中国自动化学会共同主办。

文章信息

李琦, 武旭丹

LI Qi, WU Xudan

基于ADHDP的热源供热优化控制

Optimizing Control of Heating Based on Action-dependent Heuristic Dynamic Programming

信息与控制, 2017, 46(5): 627-633, 640.

Information and Control, 2017, 46(5): 627-633, 640.

http://dx.doi.org/10.13976/j.cnki.xk.2017.0627

文章历史

收稿/录用/修回: 2016-08-15/2016-10-14/2016-11-01

文章信息

文章历史

工作空间