0 引言
目前,多智能体的协同控制受到了广泛的关注和研究,尤其在蜂拥[1-2]、编队控制[3-4]、分布式滤波[6-7]和耦合混沌振荡器的协同[8-10]等领域.一致性控制是协同控制的一个重要研究方向.对于多智能体网络的一致性研究已经取得了一定的成果:基于代数图论和频域分析,Olfati-Saber和Murray提出了解决1阶多智能体系统一致性问题的一般性框架[11].基于特征方程式和时延参数的关系,Hou等推导出了2阶多智能体系统一致性时延条件的解析式[12].通过引入新的拉普拉斯矩阵,将系统内的时延转变为拉普拉斯矩阵的一部分,并将盖尔圆盘定理与Nyquist稳定判据相结合,Tian等研究了一种针对1阶系统的带通信时延与输入时延的一致性协议[13].紧接着把相关的结果推广到了离散的情况,Tian等研究了1阶多智能体系统在带有不同通信时延及输入时延的情况下的一致性条件[14].针对2阶多智能体系统,在有向网络拓扑下,Song提出了基于位置的分布式一致性[15].此外,Wei等研究了一种带时延的PD状态反馈一致性协议,即DSDF(delayed state derivative feedback)一致性协议,在此一致性协议中,个体的状态与个体收到的邻居节点的状态都要经过状态反馈,并在反馈环节中存在时延[16].随着研究的深入,研究者们不在局限于1阶和2阶多智能体系统,在高阶多智能体系统中也取得了丰富的成果.通过运用状态向量的分解和状态空间模型的转换,针对高阶多智能体系统,在切换网络拓扑和时变的传输时延下,一组多智能体系统的一致性被研究[17].从前面的论述中可以看出,低阶和高阶的多智能体系统已经得到了充分的研究,但是实际应用中多智能体中的个体不仅仅是单输入单输出系统,多输入多输出系统也是普遍存在的,如舰船动力—推进模拟装置、工业中的过程控制、两轮平衡机器人等.两轮平衡机器人具有体积小、结构简单、运动灵活的特点,能够在狭小、复杂的空间环境中工作.然而,由于多输入多输出系统的多时滞和不同环之间的耦合性,直接设计相应的控制器较单输入单输出系统更加困难[18].针对多变量系统,如何有效地处理环耦合受到了很多研究者的关注.
近年来,研究者们提出了多输入多输出系统的控制方法[19-22]. Wang等提出了一种修正的Z-N(Ziegler-Nichols)多回路控制器整定方法,尝试用一个方程组来求解每个控制器的参数,建立这个方程组的同时考虑了回路耦合作用的影响[19].然而,这种方法不能保证解得存在性.另外,对于高维数过程而言,方程组的求解就十分复杂. Huang等提出用建立每个回路的等价过程来描述回路之间的耦合作用[20].然而,描述该等价过程必然包含了其它回路的控制器信息,于是又进一步引入了理想控制或有限带宽控制的假设[21].针对双输入双输出过程,Cai利用ETF矩阵和传递函数逆阵在完美控制假设条件下的等价关系,通过恰当地选择期望的解耦后的开环前向通道传递函数,由ETF矩阵和期望前向通道传递函数矩阵综合推导出来一个具有稳定性、正则性和因果性的解耦器[22].由此可见,等价传递函数不仅可以用于描述回路之间耦合作用的影响,而且也可以作为多变量控制器设计的有效手段.受此启发,将多输入多输出系统和多智能体系统相结合,设计相应的控制器进行系统的协同控制是可行的,具有一定的研究价值.同时,就目前而言,对于个体是多输入多输出的多智能体系统的一致性问题,还未很好的解决.
因此,本文基于等价传递函数的多变量控制方法的简单可行的特点,针对个体是双输入双输出的多智能体系统,引入等价传递函数进行多变量控制系统设计,通过ETF模型的参数化方法和合理化PID控制器结构,设计了多环PID控制器.基于Hermite-Biehler推广定理,解析地得到比例增益kp的稳定范围和具有线性特性的ki-kd稳定域.选取稳定域范围内的参数,均能保证智能体的两个输出达到一致,验证了上述方法的正确性和有效性.
1 问题描述 1.1 预备知识假设一个多智能体系统中包含p个个体,用图G(Vp,Ep)来表示系统中个体间的链接情况,其中Vp={v1,…,vp}是一个有限的非空点集,Ep⊆vp×vp表示图中的有序点集,其中的元素e(i,j)(i,j∈p)称之为边,表示的是系统内个体之间交换信息的规则. e(i,j)表示点vi可以发送信息到vj,反之则不然.若G(Vp,Ep)为无向图,则有e(i,j)∈Ep且e(j,i)∈Ep[23].
研究多智能体系统时,常用矩阵来表示系统内个体间的链接情况.定义邻接矩阵Ap=[aij]∈Rp×p,如果e(i,j)∈Ep则aij>0;反之,aij=0;如果不特殊说明,aii=0;无向图的邻接矩阵中,有aij=aji.邻接矩阵中的元素aij可以理解为智能体之间彼此交换信息的权重,若无特殊说明,一般情况下如果e(i,j)∈Ep则aij=1.如果
定义图G(Vp,Ep)的拉普拉斯矩阵为Lp=[lij]∈Rp×p,其中的元素定义为
一致性协议,代表的是多智能体系统内个体间的信息交换规则,假设Ni表示vi的邻居节点,则智能体vi的控制协议可以表示为
以单积分系统为例,有:
则由单积分和上述控制协议组成的闭环系统可以表示为
也可以用矩阵的形式表示为
其中,
多智能体系统的拓扑结构图如图 1所示.本文所研究的多智能体系统由m个双输入双输出系统的智能体组成,每一个智能体的传递函数模型为G(s). G(s)在拉普拉斯变量s有理,其形式为
(1) |
其中gij(·)(i,j∈1,2)是1阶纯滞后模型且开环稳定.每个个体对应的控制器为C(s),可表示为
其中,
其中,
因此,多智能体系统的闭环m×2输入m×2多输出系统可描述为如图 2所示.其中,
多智能体系统闭环传递表示为
(2) |
具有双输入双输出个体的多智能体系统的一致性定义为:
定义1 当:
时,称多智能体系统达到一致性.
本文针对由式(1)组成的多智能体系统,利用解析方法设计相应的PID控制器,使得多智能体的各个输出分别达到一致.
2 多智能体系统PID控制器设计 2.1 多智能体系统的一致性分析为了求得能使整个系统达到一致的PID参数域,首先需要求出各个子系统的稳定域,然后以其交集作为系统的PID参数域.假设L′是一般矩阵,因为L′是可对角化的,所以存在非奇异矩阵R使得L′=R-1ΛR.其中,Λ是对角矩阵,其对角元素λ1,λ2,…,λn均是L′的特征值.由式(2)可知,多智能体系统的特征方程为
因为L′=R-1ΛR,由矩阵理论可知:
(3) |
其中,l=1,2,…,N′;N′ < m,为拉普拉斯矩阵的非零特征值个数.
为方便叙述,令:
(4) |
注1 由式(3)可得,多智能体系统是由N′个独立的子系统组成的.当分布式控制器C(s)对每一个改进的子系统λlG(s)能够同时稳定时,则多智能体系统是稳定的,其中λl是L所有非零特征值.即对于每一个拉普拉斯矩阵L的特征值λl(l=1,2,…)而言,需要满足δl(s)所有的零点均位于复频域的左半平面.在无向网络拓扑中,拉普拉斯矩阵的特征值是大于等于0的.在有向网络中,拉普拉斯矩阵的特征值可能是复数形式,直接对其进行控制器设计需要进行下一步研究.因此,本文主要研究无向网络拓扑.
针对多智能体系统分解后的各个子系统(4),假设某一开环稳定多变量系统的传递函数为λlG(s),PID控制器是C(s),其控制系统结构如图 3所示.其中虚线部分为
(5) |
不包含ui的输出向量为
(6) |
不包含ui的输入向量为
(7) |
联立式(6)和式(7)得:
(8) |
从而可得:
(9) |
等价传递函数
(10) |
由式(10)可知,该等价传递函数含有复时延系数,直接对其控制将会很复杂.而且,实际的工业控制过程大都类似于1阶纯滞后模型(FOPDT)过程,因此假设期望传递函数为FOPDT,利用ETF与被控过程传递函数阵之间的关系,建立方程组,推出期望函数的各个参数值,再进行PID的参数域求取.根据文[24],给出FOPDT未知参数的计算公式.期望传递函数为FOPDT:
(11) |
式(11)中各参数值的定义为
(12) |
(13) |
(14) |
其中:
其中,
考虑多环控制中的相互耦合关系,本文将多变量系统分解成一系列单输入单输出系统,然后针对各个等价开环传递函数确定稳定的PID参数域.
2.2 多智能体系统的PID稳定域针对多智能体系统,给出多环PID控制器的稳定域.首先根据矩阵理论,将多智能体系统解耦成独立的单环系统.然后考虑个体是多变量系统因其多环控制中的相互耦合关系,将多变量系统分解成一系列单输入单输出系统,再设计相对应的PID控制器.针对各个单输入单输出子系统,首先求出稳定PID控制器的kp的范围.然后选择一个λ值,固定kp的范围,得到稳定的ki和kd参数的图形.遍历λ值,求取其交集即是所求PID的稳定域.
假设
定理1 在无向拓扑网络结构下,多智能体系统的个体传递函数如式(1)所示,能够使多智能体系统达到一致性的PID控制器的kp范围是:
(15) |
其中,α1是
1) 针对每个
2) 针对每个
3) 针对每个
证明 基于文[23]的定理2.1和如图 3所示的闭环控制框图可得到,
在无向网络拓扑中,其拉普拉斯矩阵的特征值满足:
从而可得到一系列的不等式:
因此,当
其中,
(16) |
(17) |
(18) |
(19) |
针对不同的λ值,都会有这3种情况.遍历所有的λ值,取其交集即是稳定域.参数mj、bj和ωj(j=1,2)可由式(17)~式(19)得到,zj(j=1,2)是式(16)的最小两个正实解.
定理2 在无向拓扑网络结构下,多智能体系统的个体传递函数如式(1)所示,能够使多智能体系统达到一致性的PID控制器的kp范围是:
(20) |
其中,α1是
1) 针对每个
2) 针对每个
3) 针对每个
证明与定理1类似,这里就不作赘述.
针对有双输入双输出个体的多智能体系统,提出了一种求解PID参数稳定域算法.首先针对ki>0或者ki < 0的情况,根据式(15)和式(20)分别得到kp的范围.然后选择λi值,对稳定范围内的kp,画出由式(16)~式(19)决定的(kd,ki)区域.遍历各个不同的λl值,求取(kd,ki)区域的交集即是该kp下的(kd,ki)稳定域.
综上所述,具有双输入双输出个体的多智能体系统PID参数稳定域的算法求解过程为:
步骤1 观察多智能体之间的网络拓扑结构,得到拉普拉斯矩阵.
步骤2 针对拉普拉斯矩阵,得到非零特征值,并标记为λ1,λ2….
步骤3 根据式(12)~式(14)计算各个个体的等价传递函数表达式,记为g1、g2.
步骤4 针对g1,获得非零特征值的最大值λmax,然后分情况讨论.如果ki>0,由式(15)得到kp的范围;如果ki < 0的情况,由式(20)得到kp的范围.
步骤5 选定一个λl,选择稳定域范围内的kp*,找到式(16)的最小两个正实解,标记为z1、z2.
步骤6 根据式(17)~式(19)计算参数mj、bj和ωj(j=1,2),其中zj(j=1,2)由步骤4决定.
步骤7 根据图 4和图 5的3种情况,得到(kd,ki)区域的稳定域,记为S(i,kp*).
步骤8 选择另一个非零特征值λl,直到取完所有非零特征值.得到(kd,ki)的交集,记为
步骤9 遍历在稳定域范围内的kp,得到(kp,ki,kd)的3维稳定域.
步骤10 返回步骤4,针对g2进行PID稳定域的求解.
3 仿真实验结合具体实例进行仿真实验,以验证所得结论的正确性.考虑个体传递函数:
其中多智能体之间的关系如图 6所示.根据拓扑结构图,可以得到拉普拉斯矩阵:
拓展的拉普拉斯矩阵可表示为L′=LⓧI2. L的特征值与L′相同,都是:λ1=0,λ2=0.221 5,λ3=1,λ4=2,λ5=5.489 3,λ6=λ7=3.289 2,λ8=λ9=4,λ10=5.其等价传递函数为
取其中一环观察实际耦合系统的输出与等价传递函数输出在相同阶跃信号下的响应,对回路1和回路2进行仿真,仿真结果如图 7所示.由仿真结果可以看出,两者的阶跃响应大致相同.
因此,基于上述特征值,将个体是双输入双输出结构的多智能体系统分解为各个子系统.基于等价传递函数方法,将双输入双输出系统解耦成两环输入单输出系统.其中第1环多智能体系统以等价传递函数g11作为解耦后的传递函数,第2环多智能体系统以等价传递函数g22作为解耦后的传递函数.根据式(15)和式(20)求得各等价传递函数对应的kp范围为kp1∈(-0.028 6,1.78)kp2∈(-0.060 5,0.018 9).为了验证可解析的表示稳定域的正确性,选择λ5=5.489 3,针对第1环多智能体系统,分3种情况讨论:1)选择kp1=-0.01属于-0.028 6 < kp1 < 0.028 6;2) kp1=0.028 6;3)选择kp1=1属于0.028 6 < kp1 < 1.78.仿真结果如图 8所示.针对第2环多智能体系统,选择λ5=5.489 3,分3种情况讨论:1) kp2=-0.05属于-0.060 5 < kp2 < -0.018 9;2) kp2=-0.018 9;3)选择kp2=0.018属于-0.018 9 < kp2 < 0.018 9,仿真结果如图 9所示.
根据上节多环PID控制器的算法,选择稳定域范围内的kp1、kp2值(kp1=0.028 6,kp2=-0.01),遍历拉普拉斯矩阵所有的非零特征值,可得到(kd,ki)的交集,如图 10和图 11所示,其中直线代表的是不同非零特征值的边界线.各自遍历稳定域内所有的kp1和kp2值,(kp1,kd1,ki1)和(kp2,kd2,ki2)的3维稳定域如图 12和图 13所示.
为了验证上述求得PID参数范围的稳定性,分别选取范围内、边界上、范围外一点(kp1,ki1,kd1)=(0.028 6,0.1,0.2),(kp1,ki1,kd1)=(0.028 6,0.3,0.3),(kp1,ki1,kd1)= (0.028,0.3,0.32)和(kp2,ki2,kd2)=(-0.01,-0.004,-0.1),(kp2,ki2,kd2)=(-0.01,-0.01,-0.1),(kp2,ki2,kd2)=(-0.01,-0.012 5,-0.13).多智能体的初始位置随机得到,观察其阶跃响应曲线以验证上述稳定域的正确性如图 14和图 15所示,其中每条曲线都代表一个智能体.
4 结论本文基于个体是双输入双输出的多智能体系统,讨论了多智能体系统的PID控制器的镇定问题,解析地给出了一种确定PID控制器稳定参数集的简单算法.首先基于矩阵理论知识,将多智能体系统分解成各个子系统.针对每个子系统,通过等价传递函数,双输入双输出的个体被解耦成单输入单输出系统.针对各个单输入单输出系统,基于PID控制器,提出了1阶时滞模型的稳定控制算法,可解析地得到各个稳定域的形状.基于Hermite-Biehler推广定理,得到比例增益kp的稳定范围. kp在不同范围内,可以解析地得到ki-kd的稳定域.通过求解子系统的稳定范围的交集来确定多智能体系统PID控制器的稳定范围.
该方法适用于个体是双输入双输出的多智能体系统,而且可解析的得到PID的参数稳定域,该方法与其它相比,计算更加简单,稳定域更加直观.同时,PID控制器稳定参数集的建立也为时滞系统的在线调节提供了方便.未来将对有向拓扑结构和个体是任意输入任意输出特征的多智能体系统继续研究.
[1] | Olfati-Saber R. Flocking for multi-agent dynamic systems:Algorithms and theory[J]. IEEE Transactions on Automatic Control, 2006, 51(3): 401–420. DOI:10.1109/TAC.2005.864190 |
[2] | Zhang H T, Zhai C, Chen Z. A General alignment repulsion algorithm for flocking of multi-agent systems[J]. IEEE Transactions on Automatic Control, 2011, 56(2): 430–435. DOI:10.1109/TAC.2010.2089652 |
[3] | Wu Z, Guan Z, Wu X, et al. Consensus based formation control and trajectory tracing of multi-agent robot systems[J]. Journal of Intelligent & Robotic Systems, 2007, 48(3): 397–410. |
[4] | Ma Z, Liu Z, Chen Z. Distributed formation control for a multi-agent system with dynamic role assignment[C]//Chinese Control Conference. Piscataway, NJ, USA: IEEE, 2015: 7118-7123. |
[5] |
焦建芳, 王光.
有向通信下的任务驱动船舶协同编队控制方法[J]. 信息与控制, 2017, 46(5): 606–613.
Jiao J F, Wang G. Task-driven cooperative formation control algorithm for vessels under directed communication topology[J]. Information and Control, 2017, 46(5): 606–613. |
[6] | Olfati-Saber R. Distributed Kalman filter with embedded consensus filters[C]//44th IEEE Conference on Decision and Control, and the European Control Conference. Piscataway, NJ, USA: IEEE, 2005: 8179-8184. |
[7] | Açıkmeşe B, Mandić M, Speyer J L. Decentralized observers with consensus filters for distributed discrete-time linear systems[J]. Automatica, 2014, 50(4): 1037–1052. DOI:10.1016/j.automatica.2014.02.008 |
[8] | Barahona M, Pecora L M. Synchronization in small-world systems[J]. Physical Review Letters, 2002, 89(5): 054101. DOI:10.1103/PhysRevLett.89.054101 |
[9] | Kristian H, Keyou Y, Frank L. Synchronization of discrete-time multi-agent systems on graphs using H2-Riccati design[J]. Automatica, 2013, 49(2): 414–423. DOI:10.1016/j.automatica.2012.11.038 |
[10] | Wang Z H, Xu J J, Zhang H S. Consensusability of multi-agent systems with time-varying communication delay[J]. Systems & Control Letters, 2014, 65(1): 37–42. |
[11] | Olfati-Saber R, Murray R M. Consensus problems in networks of agents with switching topology and time-delays[J]. IEEE Transactions on Automatic Control, 2004, 49(9): 1520–1533. DOI:10.1109/TAC.2004.834113 |
[12] | Hou W, Fu M, Zhang H, et al. Consensus conditions for general second-order multi-agent systems with communication delay[J]. Automatica, 2017, 75: 293–298. DOI:10.1016/j.automatica.2016.09.042 |
[13] | Liu C, Tian Y. Consensus of multi-agent system with diverse communication delays[C]//Chinese Control Conference. Piscataway, NJ, USA: IEEE, 2007: 726-730. |
[14] | Tian Y, Liu C. Consensus in networks with diverse input and communication delays[J]. IEEE Transactions on Automatic Control, 2008, 52(9): 2122–2127. |
[15] | Song Q, Liu F, Wen G, et al. Distributed position-based consensus of second-order multiagent systems with continuous/intermittent communication[J]. IEEE Transactions on Cybernetics, 2017, 47(8): 1860–1871. DOI:10.1109/TCYB.2017.2691714 |
[16] | Wei J, Fang H. State feedback consensus for multi-agent system with multiple time-delays[J]. Journal of Networks, 2013, 8(9): 1960–1966. |
[17] | Jiang F, Wang L, Xie G. Consensus of high-order dynamic multi-agent systems with switching topology and time-varying delays[J]. Control Theory and Technology, 2010, 8(1): 52–60. |
[18] |
王志强, 栾小丽, 刘飞. 多变量非方系统多环PI控制器设计[J]. 信息与控制, 2016, 45(5): 556-562. Wang Z Q, Luan X L, Liu F, Multi-loop PI controller design for multivariable non-square systems[J], 2016, 45(5): 556-562. http://ic.sia.cn/CN/abstract/abstract12457.shtml |
[19] | Wang Q G, Tongheng Lee A, Yu Z. Multiloop version of the modified Ziegler-Nichols method for two input two output processes[J]. Industrial & Engineering Chemistry Research, 1998, 37(12): 4725–4733. |
[20] | And H P H, Jeng J C. Monitoring and assessment of control performance for single loop systems[J]. Industrial & Engineering Chemistry Research, 2002, 41(5): 1297–1309. |
[21] | Pomerleau D, Pomerleau A. Guide lines for the tuning and the evaluation of decentralized and decoupling controllers for processes with recirculation[J]. ISA Transactions, 2001, 40(4): 341–51. DOI:10.1016/S0019-0578(00)00040-9 |
[22] | Cai W J, Ni W, He M J, et al. Normalized decoupling:A new approach for MIMO process control system design[J]. Industrial & Engineering Chemistry Research, 2008, 47(19): 7347–7356. |
[23] | Godsil C, Royle G. Algebraic graph theory[M]. New York, USA: Springer-Verlag, 2001: 16-18. |
[24] | Luan X, Chen Q, Liu F. Equivalent transfer function based multi-loop PI control for high dimensional multivariable systems[J]. International Journal of Control, Automation and Systems, 2015, 53(2): 1–7. |
[25] | Silva G J, Datta A, Bhattacharyya S P. New results on the synthesis of PID controllers[J]. IEEE Transactions on Automatic Control, 2002, 47(2): 241–252. DOI:10.1109/9.983352 |