文章快速检索  
  高级检索
主动防御的自适应最优协同制导律
胡翌玮, 蔡远利     
西安交通大学电子与信息工程学院, 陕西 西安 710049
摘要: 针对目标飞行器发射防御弹打击来袭拦截弹的主动防御问题,提出了一种防御弹的自适应最优协同制导律.首先,假设目标采用一次切换的Bang-Bang机动、防御弹已知目标状态和机动策略.接着,考虑拦截弹的制导策略未知且存在量测噪声的情况,利用基于无迹卡尔曼滤波的多模型自适应滤波器估计拦截弹状态.然后,运用最优控制理论设计了防御弹的自适应最优协同制导律.由于目标Bang-Bang机动的切换时间影响防御弹的控制能量,基于此,利用遗传算法优化切换时间.仿真结果表明利用自适应多模型估计器能够快速估计拦截弹的制导律、导航系数、距离、视线角、加速度、航向角和速度.当防御弹使用传统比例制导律失效时,利用所提方法,防御弹能够以不超过7 g的机动精确地打击拦截弹;在优化了目标Bang-Bang机动切换时间后,防御弹可以以不超过3 g的机动打击拦截弹..
关键词: 主动防御     自适应滤波器     最优协同制导     Bang-Bang机动     遗传算法    
Adaptive Optimal Cooperative Guidance Law for Active Defense
HU Yiwei, CAI Yuanli     
School of Electronic and Information Engineer, Xi'an Jiaotong University, Xi'an 710049, China
Abstract: In this study, we present an optimal cooperative guidance law for a defending missile in an active defense scenario in which an aerial target launches a defending missile to hit a homing missile. First, we assume that the target employs a Bang-Bang maneuver and the defending missile knows the target's state and maneuver strategy. Next, considering that the homing missile's guidance strategy is unknown and the measurement information has noise, we use the unscented Kalman-based multiple-model adaptive estimator to estimate the homing missile's state. Then, we propose an adaptive optimal cooperative guidance law based on optimal control for the defending missile. Since the switch time of the target's Bang-Bang maneuver has great influence on the control energy of the defending missile, we use a genetic algorithm to optimize the switch time. Simulation results indicate that our adaptive multiple-model estimator can quickly and accurately estimate the homing missile's guidance law, navigation parameters, distance, line-of-sight angle, acceleration, flight-path angle, and speed. Compared with the failure of interception when a defending missile uses the proportional navigation (PN) guidance law, its use of the proposed optimal cooperative guidance law enables it to hit the homing missile accurately with 7 g maximum acceleration load. After optimizing the switch time of the target's Bang-Bang maneuver, the proposed guidance law can ensure the successful attack of the homing missile with a 3 g maximum acceleration load.
Keywords: active defense     adaptive estimator     optimal cooperative guidance     Bang-Bang maneuver     genetic algorithm    

0 引言

先进导弹系统的研究和开发,给目标飞行器突防带了严峻的考验[1].为了提高目标飞行器突防能力,近些年目标飞行器发射防御导弹打击来袭拦截弹的主动防御策略引起了国内外学者的广泛关注.文[2]中首次探讨了目标飞行器、防御弹和拦截弹组成的三体攻防对抗问题.文[3-7]基于视线角方法设计了防御弹的制导律.基于此方法,使得防御弹能够始终在目标飞行器和拦截弹的视线方向上,从而能够打击拦截弹[3].文[4-5]分别基于最优控制理论和速度误差反馈法改进了基于视线角指令的制导律.为了进一步提高性能,文[6]中将目标飞行器视为发射平台,运用最优控制理论,最大化防御弹和拦截弹的侧向加速度,设计了防御弹的基于视线角的制导律.文[7]在文[6]的基础上,全面讨论了拦截弹使用不同制导策略下,防御弹对应的制导律.但是文[3-7]中设计的防御弹的制导律并没有考虑到目标飞行器和防御弹的协同性.文[8-11]基于微分对策理论探讨了三体攻防对抗问题,将其视为目标飞行器和防御弹组成的一方和拦截弹一方的动态博弈问题,但并未考虑量测噪声对于最优微分对策的影响.文[12-14]基于最优控制理论研究了三体问题.文[12]中,通过求解两点边值问题,设计了防御弹的协同制导律,但求解时间较长.文[13-14]中,在防御弹已知拦截弹使用典型制导律(比例导引PN、增广比例导引APN、最优制导OGL)场景下,设计了防御弹和目标飞行器的协同制导律.文[15-17]运用滑模控制理论设计了防御弹的制导律.

上述文献中的制导律均是在3种飞行器相互已知全部状态信息的条件下设计的.实际中,存在一种情况,即拦截弹的制导策略未知且目标飞行器和防御弹的量测存在噪声.基于此,本文基于多模型自适应滤波和自适应控制,运用最优控制理论,提出了一种防御弹的自适应最优协同制导律.首先,假设目标飞行器采用一次切换的Bang-Bang机动,防御弹和目标飞行器之间信息共享,防御弹和目标飞行器未知拦截弹制导策略和状态,拦截弹已知目标飞行器状态,3种飞行器均具有1阶动态特性.在此基础上,建立三体对抗的非线性运动学模型和线性化模型.接着,利用基于无迹卡尔曼滤波的多模型滤波器(UKF-MMAE)估计拦截弹制导策略和状态信息.然后,利用多模型自适应控制(MMAC)的思想,利用各模型得到的拦截弹的状态估计值,运用最优控制,设计各个模型下的防御弹的最优协同制导律,通过模型概率混合输出,得到防御弹的自适应最优协同制导律.由于目标飞行器进行一次切换的Bang-Bang机动,目标飞行器的机动切换时间对拦截弹的轨迹影响较大,进而会影响到防御弹的制导指令.基于此,利用遗传算法对目标Bang-Bang机动的切换时间进行优化,从而优化防御弹的轨迹,使得防御弹所需的控制能量最小.最后,对三体攻防对抗进行仿真,仿真结果表明,利用本文设计的防御弹的自适应最优协同制导律能够精确地打击拦截弹且通过优化得到的最优切换时间,能够使得防御弹在目标飞行器的帮助下用较小的控制能量打击高机动的拦截弹.

1 三体对抗数学模型

考虑如图 1所示的三体攻防对抗问题. T、D、M分别表示目标飞行器、防御弹和拦截弹.假设拦截弹M未知防御弹D的任何信息,目标飞行器T做具有一次切换的Bang-Bang机动,防御弹D和目标飞行器T信息共享,3种飞行器均具有1阶动态特性,三体攻防对抗发生在拦截末端,即速度可以认为不变.同时假设拦截弹M使用典型的制导律(比例导引PN、增广比例导引APN和最优制导OGL).拦截弹M的目的是拦截目标飞行器T,目标飞行器T和防御弹D在探测到拦截弹M后,在适当时间发射携带的防御弹D,防御弹D的目的是在拦截弹M拦截目标T之前打击拦截弹M,从而帮助目标飞行器进行突防.

图 1 三体对抗数学模型 Figure 1 The mathematical model of three-body engagement

XI-OI-YI表示惯性参考系;与目标飞行器、防御弹和拦截弹相关的变量用带下标t、d和m的变量表示;Vaγ分别表示速度、加速度和航向角;ρtmλtm分别表示目标飞行器T与拦截弹M的距离和视线角;ρdmλdm分别表示防御弹D与拦截弹M的距离和视线角.

在该模型中,存在两组攻防对抗问题.第1组为拦截弹M和目标飞行器T组成的对抗,用符号“M-T”表示,第2组为防御弹D和拦截弹M组成的对抗,用符号“M-D”表示.定义M-T和M-D攻防对抗的状态向量分别为

(1)
(2)

则可以得到非线性运动学模型为

(3)
(4)

其中,

(5)
(6)

τtτm分别表示目标飞行器T和拦截弹M的加速度响应时间常数,utum分别表示目标飞行器T和拦截弹M的制导指令.

防御弹D的1阶动态特性为,其中τdud分别表示时间常数和制导指令.

本文假设M-T和M-D攻防对抗发生在拦截末端且相对视线偏离初始视线角度较小,故可以将攻防对抗模型在相对的初始视线处进行线性化,从而得到线性化模型.如图 1所示,由于防御弹D是在目标飞行器T上发射出去,故而初始视线相同,均为λdm0,LOS0表示初始视线,ξ表示拦截弹M到LOS0轴的垂直距离,拦截弹M和防御弹D垂直于LOS0轴的加速度分量分别为amnadn.

定义状态,对其进行求导可以得到线性化的攻防对抗模型为

(7)

其中,amn=amcos(γm0+λdm0),adn=adcos(γd0-λdm0).

将式(7)进行整理,可以得到

(8)

其中,

在线性化模型下,防御弹D的拦截时间为.

2 基于多模型滤波的拦截弹制导律估计

由于实际中拦截弹的制导策略未知且量测存在噪声,因此本节基于多模型自适应估计的思想辨识拦截弹的制导律,估计拦截弹的状态信息.多模型自适应估计算法(MMAE)是数据融合、导航等领域中针对模型不确定而广泛采用的一种滤波方法.其思想主要是设计一组模型,利用各模型的滤波结果通过模型概率混合输出得到状态估计.由于本文研究的三体攻防对抗模型为非线性系统,考虑到传统的扩展卡尔曼滤波(EKF)方法是对系统的1阶近似,并且当系统较复杂时,求取雅可比矩阵较为困难,而UKF滤波算法不涉及求取雅可比矩阵的问题且滤波精度比EKF高,故而本节采用基于UKF的多模型自适应估计算法(UKF-MMAE)估计拦截弹制导律和状态.

2.1 MMAE模型集设计

当使用MMAE算法时,首先需要设计模型集.假设拦截弹在整个拦截过程中,使用PN、APN和OGL中的一种制导律.为了估计出拦截弹的制导律,主要需要估计出拦截弹使用的制导指令um.为此,在系统方程(4)中,需要为每个模型设计不同的umjj∈{1,2,…,r},r表示模型个数,j表示当前模型.当拦截弹使用PN、APN和OGL制导律时,其制导指令形式为[18]

(9)

其中,Nj表示制导系数,Zj表示零控脱靶量,tgotm表示拦截弹的剩余飞行时间.对于PN、APN制导律中的制导系数Nj通常取3~5,而OGL制导律的制导系数是与OGL制导律设计过程中目标函数中控制能量与脱靶量的权重比系数α相关.为此,设计12个模型来辨识拦截弹的制导律、估计拦截弹的状态信息.各个模型中的制导系数见表 1.

表 1 MMAE模型集 Table 1 Parameters of MMAE model sets
制导律 制导系数
PN Nj∈{3,3.5,4,4.5,5}
APN Nj∈{3,3.5,4,4.5,5}
OGL α∈{0,0.1}
2.2 UKF-MMAE滤波算法 2.2.1 UKF滤波算法

对设计的12个模型并行的采用UKF滤波算法进行状态估计的系统方程如式(4)所示.假设目标飞行器T和防御弹D能够同时测量距离、角度信息,但量测存在噪声,进而可以得到量测方程为

(10)

其中,zk表示k时刻的观测值,vk是量测噪声且vk~N([0]4×1R),R=diag{σ2ρdmσ2λdmσ2ρtmσ2λtm}.

利用UKF滤波算法时,在UT变换中,应用比例修正框架的比例对称采样产生Sigma采样点χj和权值向量WjmWjP,可以得到测量、测量协方差、状态与测量的协方差的预测方程及状态向量和方差更新的方程[19].限于篇幅,在这里省略.

2.2.2 模型概率更新

利用高斯密度函数确定拦截弹使用的制导模型与第j个模型的匹配度,模型j的似然函数满足:

(11)

其中,νkjSkj为模型j的新息值和新息的协方差矩阵.利用似然函数对模型概率μkj更新,计算公式为

(12)
2.2.3 混合状态估计

利用各个模型的状态估计,可以得到k时刻拦截弹的状态估计和协方差矩阵Pk|k

(13)
(14)
图 2 UKF-MMAE算法结构图 Figure 2 Structure diagram of the UKF-MMAE algorithm

本节设计的基于多模型滤波的拦截弹制导律估计方法,本质上是一种协同探测方法.利用目标飞行器和防御弹对拦截弹的观测,除了能够通过模型概率匹配,辨识拦截弹的制导律,而且能利用式(13)得到拦截弹的状态信息,因此,防御弹可以使用一对一攻防模式下所有的制导律.

3 防御弹的自适应最优协同制导律 3.1 最优协同制导律

由于目标进行一次切换的Bang-Bang机动且防御弹已知目标机动策略(切换时间),进而防御弹可以预测来袭拦截弹的轨迹,防御弹可利用此信息设计相应的制导律.从防御弹的角度出发,对本文设计的12个模型,分别设计防御弹的最优协同制导律.考虑二次性能指标函数:

(15)

其中,b是非负权重系数,u=udcos(γd0-λdm0)表示防御弹的制导指令垂直于LOS0方向的分量.

3.1.1 系统降阶

由于攻防对抗的线性化模型(8)是一个3阶系统,利用终端投影法[20]对其进行降阶处理,定义零控脱靶量Zdm(t)为

(16)

其中,D=[1 0 0];Φ(tfdmt)表示系统(8)的状态转移矩阵,满足:

(17)

对式(16)求导,可以得到:

(18)

其中,ψ(η)=exp(-η)+η-1,.

同时有:

(19)

将式(19)代入式(15),可得

(20)

至此,完成了系统的降阶处理.

注1    式(16)定义的零控脱靶量具有明确的物理意义:表示从当前时间起,防御弹不再使用任何控制输入(即ud=0)而拦截弹继续使用之前的制导方式拦截目标飞行器,造成最终防御弹打击拦截弹的脱靶量.

3.1.2 最优协同制导律的求解

式(18)~式(20)组成的最优控制问题的Hamilton函数为

(21)

协态方程和横截条件为

(22)

根据式(22)可得λz(t)=bZdm(tfdm).结合式(18),可得防御弹的最优协同制导律为

(23)

将式(23)代入到式(18)中,从ttfdm进行积分,利用Zdm(tfdm)=y1(tfdm),可得

(24)

其中,

(25)

将式(24)代入到式(23)中,可得防御弹的最优协同制导律为

(26)

其中,

(27)
(28)

利用小角度线性化模型,如图 1所示,可得:

(29)

利用式(29),可得式(27)右端前两项的近似计算为

(30)

因此可以用式(31)近似计算:

(31)

计算式(31)中的相关变量可以用滤波估计值代替或使用滤波估计结果进行计算得到.第3项采用数值积分的方式,从t时刻到tfdm时刻进行积分.

本文提出的防御弹的协同制导律(COGL)的协同性,主要体现在防御弹已知目标飞行器未来机动形式,利用该信息,可以计算得到未来时刻的拦截弹加速度,该拦截弹加速度可以用于计算更为精确的零控脱靶量(式(31)中的第3项).当拦截弹的制导指令um为恒定值时,本文提出的防御弹的协同最优制导律(COGL)退化为最优制导(OGL),则式(31)中的第3项有显示的表达式,不需要通过数值积分计算.

3.2 自适应最优协同制导律

目前,本文已经在拦截弹的加速度信息已知的情况下设计了最优协同制导律,即式(26).该制导律在拦截弹使用不同的制导方式时,可以计算得到拦截弹的不同加速度信息,故而采用对应模型下的制导律.但是在实际过程中,拦截弹制导策略未知,需要设计一种自适应制导律.多模型自适应控制[21]是在控制对象模型未知时,广泛使用的一种控制方法.故而将3.1节中对各个模型设计的最优协同制导律进行模型概率混合输出,得到防御弹的自适应最优协同制导律为

(32)

由于各个模型下,剩余飞行时间tgodm,j近似相等,则式(32)可以近似为

(33)

至此,得到了防御弹未知拦截弹制导策略下的自适应最优协同制导律(COGL).

4 目标飞行器Bang-Bang机动最优切换时间

由于目标飞行器采用一次切换的Bang-Bang机动,其切换时间对拦截弹的轨迹影响很大,进而会影响防御弹的制导指令.基于此,本节利用遗传算法对目标飞行器Bang-Bang机动的切换时间tsw进行优化,从而优化防御弹的轨迹,使得防御弹所需的控制能量最小.

根据式(33)可知,防御弹的制导指令大小依赖于当前的零控脱靶量,当选择目标飞行器Bang-Bang机动的切换时间tsw使较小时,防御弹所需的制导指令ud较小.因此,根据式(33)的自适应最优协同制导律,以零控脱靶量建立目标函数为

(34)

其中,tk表示当前时刻,tf表示防御弹与拦截弹的遭遇时刻.

当使用遗传算法时,将tsw作为优化参数,搜索区间为(1,4),采用二进制编码方式,编码长度为8位,种群规模N=10,交叉率Pc=0.9,变异率Pm=0.1,最大迭代次数Nit=50.选取式(34)的倒数作为遗传算法中的适应度函数,即:

(35)

其中,s表示种群中的个体.

在整个突防过程中,针对每个时刻tk,目标飞行器可以进行一次优化,从而确定最优的切换时间.但是在这样一个高速拦截的过程中,每次进行优化会增加计算量.因此,本文采用离线计算的方式,在攻防对抗开始之前,利用12个滤波器对拦截弹的状态估计初始值,利用遗传算法离线优化切换时间tsw,将其作为目标飞行器的装订参数使用.

5 仿真验证

为了验证本文提出的防御弹的自适应最优协同制导律,进行两组仿真实验.

场景1    利用本文提出的防御弹的自适应最优协同制导律,目标Bang-Bang机动的切换时间tsw随机给定,本文中取tsw=1.5 s.

场景2    利用本文提出的防御弹的自适应最优协同制导律,且在仿真开始前,利用遗传算法对目标Bang-Bang机动的切换时间进行优化,得到的优化结果为2.49 s.

3种飞行器的初始状态如表 2所示.目标飞行器T、防御弹D和拦截弹M的机动能力分别为10 g、25 g和30 g.式(10)中的量测噪声分别取σρi=10 m、σλi=1°(i=dm,tm).

表 2 各飞行器初始状态 Table 2 Initial states of the vehicles
x/m y/m τ/s γ/(°) V/(m/s)
目标 0 0 0.5 0 300
防御弹 0 -10 0.2 -10 600
拦截弹 5 000 0 0.2 20 600

仿真过程中,拦截弹采用APN制导,导航系数为4. UKF-MMAE滤波算法中,3种制导律的先验概率均为,滤波器的初始值用高斯分布产生,x0表示仿真系统的真实值,.

场景1的仿真结果如图 3~图 6所示. 图 3为利用第3节的UKF-MMAE滤波算法对拦截弹制导律及制导参数的辨识结果.从图 3(a)中可以发现,在1.5 s左右,已经辨识出拦截弹使用的是APN制导.在1.7 s左右,辨识出APN的导航系数为4,见图 3(b).进一步分析,可以发现,图 3(a)中PN、APN和OGL的模型概率变化曲线比较分散,这是由于这3种制导律形式差别较大,故而能够快速对拦截弹使用的制导律模型进行匹配.而图 3(c)图 3(d)中各模型概率曲线比较接近,这是由于5个PN制导模型及2个OGL制导模型中仅导航系数不同,当拦截弹使用的制导律与之不匹配时,对其影响较小.

图 3 拦截弹制导律及导航系数辨识 Figure 3 Identification of the missile′s guidance law and parameters
图 4 拦截弹状态估计值 Figure 4 The estimation of the missile′s state
图 5 场景1中各飞行器轨迹 Figure 5 The trajectories of the vehicles in scenario one
图 6 场景1中各飞行器加速度 Figure 6 The accelerations of the vehicles in scenario one

图 4是利用UKF-MMAE滤波算法对拦截弹的状态信息的估计结果.可以发现,在1.5 s之前,对于各状态的估计精度较差,这是由于在1.5 s之前,尚未辨识出拦截弹使用的制导律及导航系数,利用设计的12个模型进行模型概率加权作为状态估计时,存在模型失配的问题. 1.5 s时,能够正确地匹配到拦截弹使用的制导律及方法,在进行一次较大的跳变之后,能够精确地估计拦截弹的状态.

图 5图 6是3种飞行器的轨迹及加速度曲线.当未对目标T的Bang-Bang机动切换时间进行优化时,利用本文提出的自适应最优协同制导律,防御弹能够精确地打击拦截弹,脱靶量为0.45 m,但防御弹的轨迹较为曲折.

场景2的仿真结果如图 7图 8所示,在对目标T的Bang-Bang机动切换时间进行优化之后,利用本文提出的自适应最优协同制导律,防御弹能够精确地打击拦截弹,脱靶量为0.32 m.与场景1相比,防御弹的轨迹较为平坦.

图 7 场景2中各飞行器轨迹 Figure 7 The trajectories of the vehicles in scenario two
图 8 场景2中各飞行器加速度 Figure 8 The accelerations of the vehicles in scenario two

为了比较目标Bang-Bang机动切换时间对防御弹的控制能量的影响,绘制场景1与场景2下防御弹的加速度曲线,如图 9.可以发现,在未优化目标Bang-Bang机动切换时间时,防御弹所需的加速度基本在2 g以上,最大值达到了6.5 g.而在优化之后,防御弹所需的加速度基本在2 g以内.验证了利用遗传算法优化目标Bang-Bang机动切换时间,使得防御弹控制能量较小的可行性.这也是造成场景1中防御弹轨迹较为曲折,而场景2中防御弹轨迹较为平坦的原因.

图 9 tsw对防御弹加速度的影响 Figure 9 The influence of tswon the defender′s acceleration

为了比较本文提出的自适应最优协同制导律与传统的一对一的制导律的性能,在场景1的仿真条件下,令防御弹使用PN制导律,导航系数取4,得到仿真结果如图 10图 11所示.与场景1和场景2中的结果相比,在防御弹的机动能力为25 g下,仍不能打击拦截弹,造成的脱靶量为22.832 9 m.这是由于PN制导需要消除视线转动,在3.5 s之后,防御弹的控制输入达到了饱和,没有足够的机动能力来消除视线转动.而利用本文提出的自适应最优协同制导律,在场景1和场景2下,防御弹能够精确地打击拦截弹且所需的最大机动不超过7 g.这是由于本文中防御弹已知目标Bang-Bang机动的切换时间,能够预测出拦截弹的轨迹,进而能更加精确地计算出零控脱靶量,减少了不必要的机动,目标T在整个过程中,充当了“诱饵”的角色,将拦截弹引诱到防御弹的附近.

图 10 防御弹PN制导律下各飞行器轨迹 Figure 10 The trajectories of the vehicles under defender′s PN guidance law
图 11 防御弹PN制导律下各飞行器加速度 Figure 11 The acceleration of the vehicles under defender′s PN guidance law

接着,考虑不同噪声水平对防御弹制导性能的影响.假设目标飞行器和防御弹的传感器具有相同的测量精度,在场景1下,在不同噪声水平下分别进行100次蒙特卡洛仿真,选取保证95%杀伤概率下的脱靶量(杀伤距离)作为评价标准,仿真结果如表 3所示.

表 3 蒙特卡洛仿真结果 Table 3 The result of Monte Carlo simulations
仿真实验 σρi/m σλi/(°) 杀伤距离/m
1 10 1 0.84
2 100 1 0.85
3 200 1 1.37
4 500 1 3.03
5 1 000 1 3.74
6 10 2 2.19
7 10 4 2.84
8 10 8 8.17
9 10 10 9.30
10 100 2 2.76
11 200 4 12.98
12 500 8 17.14
13 1 000 10 发散

从实验1~实验5可以发现,在角度测量噪声的标准差σλi=1°的情况下,随着σρi的增大,制导性能逐渐变差.这是由于噪声干扰增大,设计的自适应多模型估计器对拦截弹制导模型的匹配度下降,虽能够估计出拦截弹使用的为APN制导律,但制导系数N不能准确估计.同时,可以发现即使在1 km的距离测量噪声下,为保证95%的杀伤概率,3.74 m仍是一个可接受的结果.这是由于目标飞行器和防御弹对角度测量精度较高.

与之类似,从实验1、实验6~实验9可以发现,在距离测量噪声的标准差σρi=10 m的情况下,随着σλi的增大,制导性能逐渐变差.当4个测量信息的噪声干扰均逐渐增大时,制导性能急剧下降,甚至造成计算结果发散,见实验10~实验13.

实际中,若传感器精度较高,利用本文的方法防御弹能够精确地打击来袭拦截弹.

6 结论

本文针对由目标飞行器、防御弹和拦截弹组成的三体攻防对抗问题,在目标飞行器和防御弹信息共享,目标飞行器做一次切换时间的Bang-Bang机动,拦截弹制导策略未知假设下,提出了一种防御弹的自适应最优协同制导律.首先,建立了三体攻防对抗的数学模型.然后,考略实际中拦截弹的制导策略未知,利用基于无迹卡尔曼的多模型自适应滤波算法,设计了12个模型,估计拦截弹制导律、导航系数及相关状态信息.然后,对设计的12个模型分别以防御弹控制能量和脱靶量为性能指标函数,运用最优控制理论设计防御弹的最优协同制导律,通过模型概率加权得到了防御弹的自适应最优协同制导律.由于目标Bang-Bang机动会影响到拦截弹的轨迹,进而影响到防御弹的制导指令,基于此,利用遗传算法,以防御弹控制能量为目标函数,对目标Bang-Bang机动切换时间进行优化.最后通过仿真算例验证本文提出的防御弹的自适应最优协同制导律.仿真结果表明,利用UKF-MMAE滤波算法能够快速辨识拦截弹的制导律及导航系数且能够准确地估计距离、视线角、加速度、航向角、速度信息.在防御弹使用传统PN制导律失效时,利用本文提出的防御弹的自适应最优协同制导律,防御弹能够以不超过7 g的机动精确地打击拦截弹,在优化了目标Bang-Bang机动切换时间后,防御弹可以以不超过3 g的机动打击拦截弹.但本文是基于线性化模型设计的防御弹的制导律,在使用时,需要保证攻防对抗模型能够被线性化.在后续研究中,可以考虑利用非线性模型直接设计防御弹与目标飞行器的协同制导律,以提高性能.

参考文献
[1] 刘燕斌, 南英, 陆宇平. 弹道导弹突防策略进展[J]. 导弹与航天运载技术, 2010, 37(6): 1999–2013.
Liu Y B, Nan Y, Lu Y P. Evolvement of penetration strategies for ballistic missile[J]. Missiles and Space Vehicles, 2010, 37(6): 1999–2013.
[2] Asher R B, Matuszewski J P. Optimal guidance with maneuvering targets[J]. Journal of Spacecraft and Rockets, 1974, 11(3): 204–206. DOI:10.2514/3.62041
[3] Yamasaki T, Balakrishnan S. Triangle intercept guidance for aerial defense[C]//AIAA Guidance, Navigation, and Control Conference. Los Angeles, CA, USA: AIAA, 2010: AIAA Paper 2010-7876.
[4] Yamasaki T, Balakrishnan S. Modified command to line-of-sight intercept guidance for aircraft defense[J]. Journal of Guidance, Control, and Dynamics, 2013, 36(3): 898–902. DOI:10.2514/1.58566
[5] Yamasaki T, Balakrishnan S. Intercept guidance for cooperative aircraft defense against a guided missile[C]//proceedings of the 18th IFAC Symposium on Automatic Control in Aerospace. Laxenburg, Austria: IFAC, 2010: 118-123.
[6] Ratnoo A, Shima T. Line-of-sight interceptor guidance for defending an aircraft[J]. Journal of Guidance, Control, and Dynamics, 2011, 34(2): 522–532. DOI:10.2514/1.50572
[7] Ratnoo A, Shima T. Guidance strategies against defended aerial targets[J]. Journal of Guidance, Control, and Dynamics, 2012, 35(4): 1059–1068. DOI:10.2514/1.56924
[8] Rusnak I. Guidance laws in defense against missile attack with acceleration constrained players[C]//AIAA Guidance, Navigation, and Control Conference. Los Angeles, CA, USA: AIAA, 2010: AIAA Paper 2010-8087.
[9] Perelman A, Shima T, Rusnak I. Cooperative differential games strategies for active aircraft protection from a homing missile[J]. Journal of Guidance, Control, and Dynamics, 2011, 34(3): 761–773. DOI:10.2514/1.51611
[10] Rubinsky S, Gutman S. Three player pursuit and evasion conflict[J]. Journal of Guidance, Control, and Dynamics, 2014, 37(1): 98–110. DOI:10.2514/1.61832
[11] Rubinsky S, Gutman S. Vector guidance approach to three-player conflict in exoatmospheric interception[J]. Journal of Guidance, Control, and Dynamics, 2015, 38(12): 2270–2286. DOI:10.2514/1.G000942
[12] Prokopov O, Shima T. Linear quadratic optimal cooperative strategies for active aircraft protection[J]. Journal of Guidance, Control, and Dynamics, 2013, 36(3): 753–764. DOI:10.2514/1.58531
[13] Garcia E, Casbeer D, Pachter M. Cooperative strategies for optimal aircraft defense from an attacking missile[J]. Journal of Guidance, Control, and Dynamics, 2015, 38(8): 1510–1520. DOI:10.2514/1.G001083
[14] Shima T. Optimal cooperative pursuit and evasion strategies against a homing missile[J]. Journal of Guidance, Control, and Dynamics, 2011, 34(2): 414–425. DOI:10.2514/1.51765
[15] 邹昕光, 周荻, 杜润乐, 等. 大气层外主动防御三维自适应滑模制导律[J]. 系统工程与电子技术, 2015, 37(2): 365–371.
Zou X G, Zhou D, Du R L, et al. Active defense exo-atomospheric adaptive sliding mode guidance law in three dimensions[J]. System Engineering and Electronics, 2015, 37(2): 365–371.
[16] 邹昕光, 周荻, 杜润乐, 等. 主动防御非奇异终端滑模协同制导律[J]. 兵工学报, 2015, 36(3): 476–483.
Zou X G, Zhou D, Du R L, et al. Active defense nonsingular terminal sliding mode cooperative guidance law[J]. Acta Armamentarii, 2015, 36(3): 476–483.
[17] Kumar S, Shima T. Cooperative nonlinear guidance strategies for aircraft defense[J]. Journal of Guidance, Control, and Dynamics, 2017, 40(1): 124–138. DOI:10.2514/1.G000659
[18] Zarchan P. Principles of robot motion: Tactical and strategic missile guidance[M]. Reston, VA, USA: American Institude of Aeronautics and Astronautics, 1997.
[19] 王小平, 蔡远利, 于振华, 等. 一种导弹导引律及参数的非线性MMAE辨识方法[J]. 飞行力学, 2015, 33(5): 430–434.
Wang X P, Cai Y L, Yu Z H, et al. Nonlinear MMAE-based missile guidance law and parameter identification[J]. Flight Dynamics, 2015, 33(5): 430–434.
[20] Bryson A, Ho Y C. Applied optimal control[M]. Waltham, MA, USA: Blaisdell Publishing Company, 1969.
[21] Rusnak I. Multiple Model-based terminal guidance law[J]. Journal of Guidance, Control, and Dynamics, 2000, 23(4): 742–746. DOI:10.2514/2.4593
http://dx.doi.org/10.13976/j.cnki.xk.2018.7166
中国科学院主管,中国科学院沈阳自动化研究所、中国自动化学会共同主办。
0

文章信息

胡翌玮, 蔡远利
HU Yiwei, CAI Yuanli
主动防御的自适应最优协同制导律
Adaptive Optimal Cooperative Guidance Law for Active Defense
信息与控制, 2018, 47(5): 606-614.
Information and Control, 2018, 47(5): 606-614.
http://dx.doi.org/10.13976/j.cnki.xk.2018.7166

文章历史

收稿/录用/修回: 2017-04-10/2017-09-18/2017-10-17

工作空间