文章快速检索  
  高级检索
基于LQR的异构多智能体系统的最优一致性
王静蓉, 李宗刚, 杜亚江     
兰州交通大学机电工程学院, 甘肃 兰州 730070
摘要: 考虑了一类异构多智能体系统的最优一致性问题,所考虑的系统由静态领航者、一阶跟随者及二阶跟随者三类智能体组成.在系统位置拓扑图含有生成树,且至少有一个二阶跟随者可得到领航者信息的条件下,利用线性二次调节器(LQR)理论和逆优化方法得到了系统可解最优一致性问题的充分必要条件,也即所设计控制协议在所求得的性能指标意义下是最优的.仿真结果验证了算法的有效性.
关键词: 异构多智能体系统     一致性     逆优化方法     线性二次调节器(LQR)    
LQR-based Optimal Leader-follower Consensus in Heterogeneous Multi-agent Systems
WANG Jingrong, LI Zonggang, DU Yajiang     
School of Mechanical Engineering, Lanzhou Jiaotong University, Lanzhou 730070, China
Abstract: We investigate the optimal leader-follower consensus problem in heterogeneous multi-agent systems, which consist of one static leader, first-order followers, and second-order followers. Under conditions in which the position digraph contains a spanning tree and at least one second-order follower takes the static leader as a neighbor, we present the necessary and sufficient condition for this system to achieve optimal consensus by employing the linear-quadratic regulator (LQR) theory and the inverse optimization method. In this sense, the proposed control protocols for each follower are optimized with respect to the obtained linear-quadratic-performance index function. The simulation results confirm the validity of the proposed method.
Keywords: heterogeneous multi-agent system     consensus     inverse optimality     linear quadratic regulator (LQR)    

0 引言

一致性问题是多智能体系统领域中最为活跃的研究方向之一,其目标是多个智能体基于局部信息就某一协商变量达成一致.其中,最优一致性是指多智能体系统在可解一致性问题的同时,满足给定的性能指标要求[1].

目前,针对同构多智能体系统的最优一致性问题研究已取得很多成果[2-6]. Cao[2]在连续/离散时间下,提出了与拓扑图无关和相关的两个成本函数,其中与拓扑图无关成本函数取极小值的条件是系统信息交换拓扑为有向完全图,并给出了使与拓扑图相关成本函数最优的比例因子. Wang[3]在Leader-Following框架下,给出了与拓扑图无关的二次型成本函数取极小值的条件是系统信息交换拓扑为星形图. Lewis[4]利用逆优化和局部稳定性方法研究了一般线性系统的最优一致性问题.文[5]研究了基于LQR(liner-quadratic regulator)的二阶多智能体系统最优一致性问题.文[6]在给定的最优控制协议下,通过逆优化方法得到了使系统可解最优一致性问题的标量耦合增益取值范围.

此外,科研工作者还针对异构多智能体系统的最优一致性问题展开研究[7-12]. Zheng等[9]研究了包含一阶和二阶积分器的异构多智能体系统的一致性问题,对于线性一致性协议,得到了解决一致性问题的充分条件,并在文[10]和文[11]中分别研究了有限时间异构多智能体系统一致性问题和包围控制问题. Wang[12]研究了异构多智能体系统的最优一致性问题,利用LQR方法得到了系统的最优拓扑结构.

本文利用逆优化方法,针对具有固定拓扑的异构多智能体系统最优一致性问题进行研究,给出了系统可解该问题的一组线性矩阵不等式条件.

1 问题描述 1.1 预备知识

G=(VEÂ)表示具有N个顶点的有向图,其中V={v1,…,vn}为顶点集,E={(vivj)}为边集,Â=[aij]为顶点之间的邻接矩阵,di=∑j=1naij为顶点vi的出度,ij=1,…,n.当(vivj)∈E时,表示顶点vj可以接收到顶点vi的信息,令Ni={vj(vjvi)∈E}表示顶点vi的邻居集合,D=diag{d1,…,dn}和L=D-Â分别为图G的出度矩阵和拉普拉斯矩阵.称(vi1vi2),(vi2vi3),…为图G的一条路径,若G中每个顶点都存在一条到其它任意顶点的有向路径,则称图G示强连通的;若至少有一个顶点存在到其它所有顶点的有向路径,则称图G含有生成树.

1.2 异构多智能体系统建模

考虑由n个跟随者和一个静态领航者组成的异构多智能体系统,令领航者动力学方程为

(1)

m个二阶跟随者的动力学方程为

(2)

其余n-m个一阶跟随者的动力学方程为

(3)

对领航者和跟随者均有xi(t)∈RNvi(t)∈RNui∈RN.取m个二阶跟随者的控制协议为

(4)

n-m个一阶跟随者的控制协议为

(5)

其中,bi≥0,di≥0表示第i个跟随者与领航者之间的关系.取性能指标函数为

(6)

其中,

Q≥0为待定的半正定矩阵,R>0为给定的适维正定矩阵.为简化起见,取N=1.令Lp表示所有个体位置图的拉普拉斯矩阵,Lv表示m个二阶跟随者和领航者速度图的拉普拉斯矩阵,则由式(4)和式(5)可得

其中,Lvm个二阶跟随者速度图拉普拉斯矩阵,b1=[b1,…,bm]Tb2=[bm+1,…,bn]TB1=diag{b1,…,bm},B2=diag{bm+1,…,bn},f=[f1,…,fm]TF=diag{f1,…,fm}.

本文所考虑的问题即为寻找满足条件的Q使得系统对于性能指标(6)取极小值.为此,需要如下引理.

引理1[13]    已知线性定常系统:

完全能控,其二次型性能指标由式(6)给定,则存在唯一的最优控制输入:

使得式(6)取极小值.其中P是代数黎卡提方程:

的非负定对称解,且从任意初始状态开始的最优性能指标为J*=x0TPx0.

引理2[14]    对于任意分块Hermitian矩阵:

Q>0当且仅当:

或:

此外,系统的通信拓扑还需满足如下假设:

假设1    对于所考虑的多智能体系统(1)~(3),其控制协议由式(4)、式(5)给出,假设其位置拓扑图具有生成树,且至少有一个二阶跟随者能接受到领航者的信息.

3 主要结论

定理1    考虑由式(1)~式(3)描述的异构多智能体系统,跟随者的控制协议由式(4)和式(5)给定,系统性能指标由式(6)给定,其通信拓扑满足假设1.则系统可解最优一致性问题的充分必要条件是:

其中,P11满足如下线性矩阵不等式:

证明    取:

则式(2)~式(5)可写为

(7)

其中,

(8)

取误差信号:

其中,

则有:

(9)

对式(9)两边关于时间t求导并化简可得:

(10)

由式(8)及:

可得:

(11)

由假设1可知,即L11+B1=Lv+D.将式(11)代入式(10)可得

(12)

如果A1的所有特征值都具有负实部,即矩阵A1为Hurwitz矩阵时,那么误差系统是渐近稳定的.即所给控制输入能够实现领导者—跟随者一致性问题.下面证明A1的所有特征值都具有负实部.由式(12)可知:

容易验证,-(L22+B2)的n-m个特征值均具有负实部,矩阵的2m个特征值均有负实部,因此矩阵A1n+m个特征值均具有负实部.从而误差系统(12)是渐近稳定的,也即一致性问题可解.以下利用逆优化方法寻找一个正定矩阵Q,使得成本函数(6)取极小值.

由最优控制理论可知,反馈增益矩阵可表示为

(13)

取:

(14)

由式(13)、式(14)可得:

(15)

即有:

将式(8)和式(14)代入黎卡提方程:

(16)

可得

(17)

只需证明Q>0,P>0成立.由引理2可得,P>0等价于:

(18)

A=P11-1,则式(18)为一线性矩阵不等式.同理可得,Q>0等价于:

(19)

其中,

(20)

令:

则式(20)可写为

(21)

由引理2可知,式(21)可写为

(22)

其中

由于A=P11-1,故约束:

(23)

成立.结合式(18),式(22)、式(23)可知,定理得证.

3 仿真

考虑由2个二阶跟随者,2个一阶跟随者和1个领航者组成的异构多智能体系统,其信息交换拓扑如图 1所示.取N=1,领导者的初始状态为x5(0)=2,跟随者的初始状态为

图 1 系统信息交换拓扑 Figure 1 Communication topology of the system

由定理1,可解得:

因此所考虑系统可解最优一致性问题,仿真结果如图 2图 3所示.由图 2可知,所有跟随者的状态均收敛到领航者;图 3(a)为2个二阶跟随者的速度图,二阶跟随者的速度最终趋于0;从图 3(b)中可知,所有跟随者最终都收敛到静态领航者所在位置.

图 2 误差变量的变化轨迹 Figure 2 The trajectories of error variables
图 3 多智能体系统状态变化轨迹 Figure 3 The trajectories of multi-agent system variables
4 结论

本文研究了一类带有领导者的异构多智能体系统最优一致性问题.在系统位置拓扑图含有生成树,且至少一个二阶跟随者能够得到领航者信息的条件,利用逆优化方法得到了系统可解异构最优一致性问题的充分必要条件,也即所设计的控制协议在所求得的性能指标意义下是最优的.在后续工作中,将针对动态领航者情形进行研究.

参考文献
[1] 马婧瑛, 郑元世, 王龙. 多智能体系统的性能优化[J]. 系统科学与数学, 2015, 35(3): 270–286.
Ma J Y, Zheng Y S, Wang L. Performance optimization of multi-agent systems[J]. Journal of Systems & Mathematics Science, 2015, 35(3): 270–286.
[2] Cao Y, Ren W. Optimal linear-consensus algorithms:An LQR perspective[J]. IEEE Transactions on Systems Man & Cybernetics:Part B, 2009, 40(3): 819–30.
[3] Ma J, Zheng Y, Wang L. LQR-based optimal topology of leader-following consensus[J]. International Journal of Robust & Nonlinear Control, 2014, 25(17): 3404–3421.
[4] Lewis F L, Zhang H, Hengster-Movric K, et al. Cooperative optimal control for multi-agent systems on directed graph topologies[J]. IEEE Transactions on Automatic Control, 2014, 59(3): 769–774. DOI:10.1109/TAC.2013.2275670
[5] Li Z G, Zhang T Z, Xie G M. LQR-based optimal leader-follower consensus of second-order multi-agent systems[C]//Proceedings of the 2015 Chinese Intelligent Systems Conference. Berlin, Germany: Springer, 2016.
[6] Zhang H, Feng T, Yang G H, et al. Distributed cooperative optimal control for multi-agent systems on directed graphs:An inverse optimal approach[J]. IEEE Transactions on Cybernetics, 2015, 45(7): 1315–1326. DOI:10.1109/TCYB.2014.2350511
[7] 杨文. 多智能体系统一致性问题研究[D]. 上海: 上海交通大学, 2009.
Yang W. Consensus problem in multi-agent systems[D]. Shanghai: Shanghai Jiao Tong University, 2009. http://cdmd.cnki.com.cn/Article/CDMD-10248-2009109353.htm
[8] Geng H, Chen Z Q, Liu Z X, et al. Consensus of a heterogeneous multi-agent system with input saturation[J]. Neurocomputing, 2015, 166: 382–388. DOI:10.1016/j.neucom.2015.03.044
[9] Zheng Y, Zhu Y, Wang L. Consensus of heterogeneous multi-agent systems[J]. IET Control Theory & Applications, 2011, 5(16): 1881–1888.
[10] Zheng Y, Wang L. Finite-time consensus of heterogeneous multi-agent systems with and without velocity measurements[J]. International Journal of Control, 2012, 61(8): 871–878.
[11] Zheng Y, Wang L. Containment control of heterogeneous multi-agent systems[J]. International Journal of Control, 2013, 87(87): 1–8.
[12] Wang H, Ma J. Optimal topology for consensus of heterogeneous multi-agent systems[J]. Neurocomputing, 2015, 177: 594–599.
[13] 解学书. 最优控制:理论与应用[M]. 北京: 清华大学出版社, 1984.
Xie X S. Optimal control theory and application[M]. Beijing: Tsinghua University Press, 1984.
[14] 俞立. 鲁棒控制——线性矩阵不等式方法[M]. 北京: 清华大学出版社, 2002.
Yu L. Robust control-LMI method[M]. Beijing: Tsinghua University Press, 2002.
http://dx.doi.org/10.13976/j.cnki.xk.2018.7005
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

王静蓉, 李宗刚, 杜亚江
WANG Jingrong, LI Zonggang, DU Yajiang
基于LQR的异构多智能体系统的最优一致性
LQR-based Optimal Leader-follower Consensus in Heterogeneous Multi-agent Systems
信息与控制, 2018, 47(4): 468-472.
Information and Control, 2018, 47(4): 468-472.
http://dx.doi.org/10.13976/j.cnki.xk.2018.7005

文章历史

收稿/录用/修回: 2017-01-09/2017-04-18/2017-06-28

工作空间