基于BP神经网络的自适应偏置比例导引

2022-12-01 12:38刘畅王江范世鹏李伶林德福
兵工学报 2022年11期
关键词:偏置交会制导

刘畅,王江,范世鹏,李伶,林德福

(1.北京理工大学 宇航学院,北京100081;2.北京理工大学 中国- 阿联酋智能无人系统“一带一路”联合实验室,北京100081;3.北京航天自动控制研究所,北京 100854)

0 引言

随着现代战场环境的日益复杂,作战需求给制导问题带来了一些特殊的限制。在对地目标攻击等制导问题中,为保证杀伤效果、提高战斗部效能,需要以特定角度攻击目标薄弱部位[1-3]。

目前,一些最优制导律由于无法得到解析解而在工程中难以应用,传统比例导引律[4](PNG)具有所需信息量少、结构简单等优点,工程上得到广泛应用。传统PNG无法对终端交会角进行约束,有学者在此基础上提出了偏置比例导引律[5](BPNG)。Kim[6]最先将BPNG引入解决终端交会角约束问题上,设计的时变偏置项与剩余飞行距离相关。文献[7]设计了一种不含线性近似项并将PNG与终端交会角误差进行反馈的BPNG,所设计的制导律中包含剩余飞行时间。文献[8]为提高反坦克导弹的毁伤效果,设计了一种BPNG并研究对法向过载的影响,所设计的BPNG同样需对剩余时间进行估计。文献[9]为解决前置角变化较大的问题,设计了一种可满足初始前置角及终端交会角的BPNG,并给出应用该制导律时所需剩余飞行时间估计的方法。以上文献所设计的BPNG均需对剩余飞行时间进行估计,准确性直接影响终端交会角的精度,且推导时采用小角假设等条件,在大范围机动时并不能成立。若采用红外制导弹药,则在硬件需求上会产生额外的问题[10]。因此,无需估算飞行剩余时间的BPNG[11-12]优势更加明显。

常值偏置比例导引(CBPNG)即在BPN基础上扩展带有常数值的偏置项,CBPNG可分为两部分,一部分是传统PN,实现零控脱靶量(ZEM);另一部分为带有常数项的偏置项,实现对终端交会角的约束。CBPNG结构简单、无需复杂的计算,尤其是无需估算飞行剩余时间,在工程上较有优势。偏置项精确程度直接影响制导精度,应用全程CBPNG时,仍需对飞行总时间进行估计。通过公式不难发现,常数值与前置角、终端交会角、比例系数、飞行距离、速度等存在映射关系。神经网络[13](NNs)在拟合逼近复杂映射关系方面拥有显著的优势。因此,对于上述映射关系,利用神经网络进行拟合,无需对飞行时间进行估计,从而提高终端角度与位置的精度。

随着人工智能技术的不断发展,很多学者将神经网络方法应用在制导问题上。文献[14]利用BP神经网络逼近变系数非齐次弹道微分方程解算,实现了潜地导弹落点的快速计算。文献[15]应用神经网络实时估计目标运动信息,使制导律自适应调整参数,减少三维运动模型中的耦合干扰,从而提高制导律的鲁棒性。文献[16]应用门循环单元神经网络,将敌我双方运动信息作为输入进行训练,解决了敌方拦截弹制导律辨识问题。文献[17]设计了一种考虑扰动随机性的神经网络制导律,神经网络可对出现的扰动进行在线补偿。文献[18]应用神经网络提出一种预测校正容错制导算法,解决了故障条件下高超声速飞行器的容错制导问题。将升力系数、阻力系数的变化量作为输入量,通过神经网络预测落点,可避免传统算法中需大量进行积分运算的问题。文献[19]通过飞行仿真得到的当前、未来态势及控制量作为样本,经深度神经网络训练,训练完毕的模型可根据当前信息快速预测未来态势,并能对空战态势进行评估。

本文针对以设定的终端交会角精确打击目标的实际需求,提出一种基于BP神经网络的偏置比例导引(NNCBPNG)方法,利用BP神经网络拟合包括期望终端交会角θf在内的多元参数与偏置项之间的映射关系,从而实现在线求解偏置项。首先,建立相对运动学数学模型,证明了常值偏置项与期望终端交会角之间存在一一映射关系;然后,针对前置角、终端交会角等参量对偏置项的影响,进行灵敏度分析,得到针对不同参数的样本采样策略。以初始条件与期望终端交会角作为输入,以偏置项作为标签,采用上述采样策略,构建参数均衡的样本库。随后,采用Adam学习律,对BP神经网络进行训练。最后,将训练完毕的网络与传统的解析求解进行对比,验证了本文方法可快速得到偏置项常数,制导精度更高。

1 运动学建模及偏置比例导引的分析

1.1 运动学建模及偏置导引推导

考虑带落角约束的精确制导场景,图1为导弹M与目标T之间的相对运动几何关系。图1中,v为导弹速度,假设速度为常值;θ为弹道倾角,q为弹目视线角,η为导弹速度与弹目视线(LOS)的夹角,aM为导弹的加速度指令。

图1 弹目之间角度关系

弹目相对运动方程为

(1)

(2)

(3)

(4)

式中:

aMq=aMcos(θ-q)

(5)

存在角度关系为

η=θ-q

(6)

为达到期望的终端交会角,BPNG理论引入一个常值偏置,其大小与初始条件和终端条件均有关。

可将弹道倾角角速度表示为

(7)

式中:b为角度控制的偏置项,在CBPNG中为常数,N为比例系数。此时aM为

(8)

对于(8)式可理解为

aM=aN+ab

(9)

式中:aN为PNG部分,用以减小零效脱靶量;ab为偏置项部分,可将终端交会角收敛于期望值。

1.2 解析偏置比例导引误差分析

对(7)式进行积分,得

(10)

式中:θ0为初始弹道倾角,当t为终端时间tf时,(10)式变为:

(11)

θf为终端交会角,qf为终端弹目视线角。对于地面固定目标,终端速度方向指向弹目视线方向,有θf=qf,代入(11)式可得终端交会角:

(12)

由(12)式可知,通过调整偏置比例导引中的偏置项b大小,即可实现终端交会角θf的控制。

若采用CBPNG,则偏置项常数与终端角之间的关系为

(13)

若采用全程偏置比例导引,则公式中tf-t0为飞行总时间。文献[6]提出求飞行总时间的传统方式:

t=tf-t0=r/v

(14)

应用(14)式计算时需对速度、弹目距离进行精准测量,其精度直接影响常数选取的误差。且(13)式的推导过程中应用小角假设等假设条件,同样会对常数的选取产生误差。

下面讨论当qf(或θf)、q0及距离r变化时对偏置项常数b的影响。为减少与偏置项相关的自变量,这里仅关注qf、q0的相对变化量,即qrqf-q0。

(15)

对于qr的灵敏度分析,设置的仿真参数见表1。

表1 仿真参数

图2 视线角变化量对的影响

对于初始距离r0,仿真参数见表2。

表2 仿真参数

图3 r0对的影响

由上述分析可知,(13)式存在误差,尤其是当qr相差较大时。初始弹目距离较远时,公式存在的误差同样不可忽视。目前对于飞行总时间的求解方式均存在一定的误差。由(13)式可知,偏置项常数b与N、q0、θ0、θf、r0等存在非线性映射关系。神经网络在拟合非线性映射问题上有较大优势。因此,本文在不估计或求解飞行总时间的情况下,采用神经网络表征N、q0、θ0、θf、r0与偏置项b的映射关系。

2 模型与样本建立

2.1 映射分析

若应用神经网络解决上述问题,需要证明偏置项常数b与θf等存在映射关系。下面将给出映射关系的证明。(13)式可转化为

(16)

上述公式存在误差是由于小角度假设及对飞行总时间估算不准确产生的。对于实际对应关系,可加入角度、时间的偏差项Δη及Δt进行补偿。将(14)式及Δη、Δt代入(16)式,得:

(17)

式中:N、q0、θ0、r0、v等初始参数均已知,可看作是常数。θf在通常情况下取负值,则(17)式变为

(18)

θf=f(r0,N,q0,θ0,b)

(19)

定理1设y=f(x),x∈D严格增(减),则f必有反函数f-1,且f-1在其定义域内f(D)上也是严格单调函数。

定理1证明:f在D上严格增,因此任一y∈f(D),有x∈D使f(x)=y。

若x1∈D有,且x1≠x,使f(x1)=y;则y=f(x)非严格增;所以对每一个y∈f(D),有唯一的一个x∈D,使f(x)=y;从而函数f存在反函数x=f-1(y),y∈f(D)。

对于任意的y1、y2∈f(D),y1x2,即f-1(y1)>f-1(y2),则f-1在其定义域f(D)上也是严格减函数。

由定理1可知,式(19)的反函数同样是严格递增函数,则同样有|θf|与b存在一一映射关系,如(20)式所示:

b=f-1(f0,N,θ0,qr)

(20)

对于(19)式、(20)式可近似为逆变换,在理想情况下,反演是精确的。但由于近似变换或参数的发生变化,导致逆过程出现反演误差。神经网络可用于表示该非线性逆变换,在离线训练时使用精确的数学模型进行训练,该模型可提供适应总飞行包络线的近似反演,从而使神经网络在线补偿该反演误差。

若将输入中每个维度的所有数据作为样本,会导致样本量过多,使计算量大大增加。每个维度对b的影响并不相同,因此可对每个维度进行灵敏度分析,选择合适的样本间隔,采用不同的样本策略,可在保证精度的情况下减少计算量。

2.2 灵敏度分析

在优化理论中,常常利用灵敏度分析研究原始数据不准确或发生变化时最优解的稳定性[20]。通过灵敏度分析可得出参数对系统或模型的影响程度。

本节主要分析r0、N、θ0、qr等参数变化对偏置项常数敏感程度的影响。对(20)式进行求导,得

(21)

根据2.1节的分析可知,b与r0、N、θ0、qr存在映射关系,即存在函数关系,因此,(21)式可展开为

(22)

根据(13)式和(16)式,可将(22)式进行展开,得

(23)

由于(23)式中Δη、Δt是未知参数,无法得到此方程的解析解。但可通过仿真验证的方式判断每个参数的变化对偏置项常数b的影响程度。

建立数据库,给出(20)式中每个维度的边界。4个维度的边界分别为r0∈(5,10)km,N∈(2,4),θ0∈(10,20)deg,qr∈(-40,-70)deg。

分析r0的灵敏程度。将其它3个维度(N,θ0,qr)分为3个层次,标记为f-1(r1)、f-1(r2)、f-1(r3),参数分别为(3,10°,-40°);(3,15°,-55°);(3,20°,-70°),3个参数代表下限、中值、上限。将3种情况分别进行仿真,结果如图4所示。

图4 r0对b的影响

从图4中可以看出,无论下限值、中值还是上限值,r0变化对b值的影响相对较小,即灵敏度较低。但整体呈下降趋势,因此r0取值较小时,样本选取间隔应较小。r0取值较大时,样本选取间隔应较大。

下面分析b的灵敏程度。将其他3个维度(r0,N,qr)分为3个层次,标记为f-1(θ1)、f-1(θ2)、f-1(θ3),参数分别为(5 000 m,3,-40°);(7 500 m,3,-55°);(10 000 m,3,-70°),3个参数代表下限、中值、上限。将三种情况分别进行仿真,得到的结果如图5所示。

图5 θ0对b的影响

从图5可以看出,无论是下限值、中值还是上限值,θ0变化对b值的影响相对较小,即灵敏度较低。且整体呈平缓趋势,因此选取样本θ0时间隔可较大。

下面分析qr的灵敏程度。将其他3个维度(r0,N,qr)分为3个层次,标记为f-1(qr1)、f-1(qr2)、f-1(qr3),参数分别为(5 000 m,3,10°);(7 500 m,3,15°);(10 000 m,3,20°),3个参数代表下限、中值、上限。将3种情况分别进行仿真,得到的结果如图6所示。

图6 qr对b的影响

从图6中可以看出,无论是下限值、中值还是上限值,qr变化对b值的影响相对较大。尤其是下限值,随着qr逐渐增大,误差越来越大。由此可知qr变化对b影响程度大,即对应的灵敏度较高。整体呈上升趋势,因此qr越大时,需要更小的间隔保证精度。

综上所述,θ0的灵敏度最小,r0的灵敏度次之,qr的灵敏度最大。以上分析为样本建立提供了均衡分布采样的策略依据。

2.3 样本建立

网络的训练是指调整权重和偏移,以获得所需输入输出关系的过程。反向传播调整网络的权值和偏差,使神经网络在输出层的和平方和误差最小。通过为神经网络提供一个输入向量,并根据当前的权重和偏差值计算输出,然后在神经网络输出与输入对应的实际输出之间误差的最大梯度方向上不断改变权值和偏差的值,直到满足指定的误差[21]。根据式(20),本文将不同的初始距离r0,导引系数N,初始弹目视线角q0,初始弹道倾角θ0,期望终端交会角θf作为样本输入,经过神经网络训练得到此状态下的偏置比例常数b。样本输入形式为:

(24)

式中:ni表示第i时刻的输入向量,上标分别代表上述的输入量,n为输入步数。

当神经网络完成训练后,利用测试样本对网络的泛化能力进行检验[22]。这种泛化特性使得网络可以在具有代表性的训练样本集上进行训练,而若测试样本集的测试误差越小,则认为此时神经网络鲁棒性越强。

根据上节分析结果,在保证精度的同时,减少训练样本量,节约训练时间。因此,本文对r0在 5 000~7 500 m范围内采样步长为100 m,在7 500~10 000 m范围内采样步长为50 m;θ0采样步长为1°;qr采样步长为0.5°。

3 基于神经网络的偏置项常数估算

3.1 BP神经网络

神经网络[23]是一种具有很强的非线性拟合能力的数学方法,可以解决一些应用传统推理模型无法解决的问题。通过对训练数据中隐含模式的提取,学习和训练,调节各节点的权重,神经网络的输出值趋近于期望输出。其中,BP神经网络[24]结构简单、具有较强的抗噪和泛化能力而用于拟合各类复杂映射。其主体通常包括输入层、隐藏层、输出层,相邻两层间的数据传输通过权值传递的形式进行。每个神经元的输入数据通过激活函数进行处理,因而每个神经元都需有适用的激活函数。神经元的结构模型如图7所示。

图7 神经元结构

其数学模型如(25)式所示。

(25)

式中:xi为神经元第i个输入;ωi为对应权值;b为阈值;f(·)表示激活函数;y为神经元的输出。其中,Sigmoid函数具有平滑、易于求导等优点得到广泛应用,表达式为

(26)

其导数为

f′(x)=f(x)(1-x)

(27)

由(27)式可以看出,Sigmoid函数可将一个函数映射到(0,1)区间且具有良好的对称性,因此本文将sigmoid作为激活函数。对隐藏层和输出层的每一个节点都按照(25)式计算输出值,即完成前向传播的过程。

3.2 基于Adam算法的网络训练

对于反向传播的具体流程为:本文选取最小均方误差作为损失函数(Loss Function),即估计值与实际值误差平方的均值,表达如(28)式所示。

(28)

式中:n为样本个数;y为输出值,(25)由式得到;为期望输出值。输出值与期望输出值相减后得到误差后,在网络中进行传播。以求解ωhj为例,设该误差为Ek,给定学习率η,有

(29)

式中:ωhj为第h个神经元与第j个神经元的权值。根据链式法则,有

(30)

(31)

根据(25)式、(27)式、(28)式,有

(32)

式中:θj为输出层第j个神经元的阈值。将(32)式和(31)式代入(30)式,再代入(29)式,就得到了BP算法关于ωhj的更新公式:

Δωhj=ηgjch

(33)

BP神经网络的训练过程,就是通过上述反向传播,利用梯度下降等算法不断优化网络参数,使上述网络的误差平方和最小。(33)式中的学习率恒定,致使收敛较慢。本文采用的Adam学习方法,结合了Momentum及RMSprop算法各自的优点,实现了学习率自适应调节,从而加速网络收敛[25]。当更新方向发生变化时,减少权重变化量,反之则增大权重变化。因此,本文采用Adam算法对BP神经网络模型进行训练。

基于Adam算法的网络参数α更新公式为

(34)

(35)

式中:αt为更新前参数;αt+1为更新后参数;η为学习率;mt为梯度1阶力矩,vt为梯度2阶力矩,通过计算偏差修正1阶和2阶力矩估计减小偏差;m′t为1阶力矩估计,v′t为2阶力矩估计,β1、β2为超参数,用于修正1阶和2阶力矩估计,本文分别取0.9和0.99;ε为平滑项,防止被零除,⊙为按元素乘运算符。

神经网络结构、规模与计算量、求解精度密切相关。本文待拟合的映射关系具有单调性,复杂度相对较小,设定隐含层为3层,每层神经元个数为15个,各层之间采用全连接方式,计算代价较小。根据3.1节基于灵敏度分析的样本采样策略,利用数学仿真批量生成样本,完成BP神经网络训练后即可在线使用。基于TensorFlow-1.13.0-GPU版构建神经网络模型,显卡型号为RTX 2060 6G,训练算法为Adam算法,学习率为0.001。本文的技术架构如图8所示。

图8 样本构建与模型训练

下面讨论b的有界性。对于神经网络的最后一层,有

h=f(ω·x+c)
y=ω·h+c

(36)

式中:ω、c分别为神经元的权值和阈值。(36)式可写成范数形式为

‖y‖=‖ω·h+c‖

(37)

等式右边由范数三角不等式有:

‖ω·h+c‖≤‖ω·h‖+‖c‖

(38)

对于神经网络最后一层的输入h,即为前一层的输出。本文的激活函数为sigmoid函数,因此其值域为[0,1)。因此有‖ω·h‖≤‖ω‖,因此(38)式可变为

‖ω·h+c‖≤‖ω‖+‖c‖

(39)

由神经网络的性质可知,ω、c中的值为网络参数,只要训练后的网络参数有界,根据(39)式,神经网络的输出,即偏置项b,就是有界的,则该制导律即为稳定的。因此,当神经网络完成训练后,必须对网络参数要进行稳定性检验,本文要求最后一层权值满足‖ω‖≤10,‖c‖≤10。

4 仿真验证

为验证提出方法的有效果,仿真验证分三部分。第一部分为当打击静止目标时,与CBPNG的对比验证;第二部分为当打击低匀速目标时与CBPNG的对比验证;第三部分进行蒙特卡洛仿真实验,对比当考虑导引头不确定性时,所设计的制导律相较于CBPNG优势明显。

4.1 打击静止目标时与CBPNG对比验证

为验证本文提出的制导律相较于原始CBPNG方法精度更高,本节将进行对比验证。仿真相关参数如表3所示。

表3 仿真参数

期望终端交会角分别为-40°、-60°、-80°,图9为传统偏置比例导引与本文所提出的基于神经网络偏置比例导引对比仿真的结果。

图9 两种制导律对比验证

终端交会角对比如表4所示,脱靶量对比如表5所示。

表4 终端交会角

表5 脱靶量

由表4和表5可以看出,虽然两种制导律均可精确命中目标,但在终端交会角上,本文设计的制导律相较于CBPNG精度有明显优势。尤其是大角度范围机动时,NNCBPNG相较于CBPNG的优势更为明显。

4.2 打击低匀速目标时与CBPNG对比验证

由于在模型建立与样本生成时,并未考虑目标的运动速度,因此训练完毕的神经网络模型仅能适用于静止或低速运动目标,为验证基于神经网络的偏置比例导引的鲁棒性,本节仿真条件考察对低速运动目标的打击精度。同样期望终端交会角θf分别设为-40°、-60°、-80°,当目标水平匀速运动或垂直匀速运动时,仿真参数如表6和表7所示。

表6 水平运动仿真参数

表7 垂直运动目标仿真参数

图10为目标匀速水平匀速运动时的仿真结果,图11为目标垂直匀速水平运动时的仿真结果。

由图10和图11可以看出,虽然两种制导律均可精确命中目标,但在终端交会角上,本文设计的制导律相较于CBPNG精度有明显优势。与目标静止对比验证相似,尤其是大角度范围机动时,NNCBPNG相较于CBPNG精度优势更加明显。由此可见该制导律可凭借其鲁棒性,实现对低速运动目标的精确打击,从而表明该制导律适用于精确打击装甲车、坦克和直升机等一类目标。

图10 目标匀速水平运动时实验验证

图11 目标匀速垂直运动时仿真验证

4.3 蒙特卡洛仿真验证

为验证不同场景下的制导性能,采用蒙特卡洛仿真方法进行验证。导弹坐标为(0,0),其他初始条件相关参数分布均匀,速度为300 m/s,导航系数设为3,其余参数从表8的范围中随机选取。

表8 仿真参数

从表8的参数范围中,随机抽取300组不同的目标位置,用以验证训练模型的准确性。实际终端交会角误差如图13所示。

图12 蒙特卡洛仿真结果

由图13可知,训练完毕的模型精度较高。其中,最大误差为0.115°,最小误差为0.001 7°。误差平均值为0.030 58°,标准误差为0.047 2°,由此可见误差离散程度小,制导精度较高。

图13 高斯白噪声

考虑到导引头的不确定性,以典型的雷达导引头为例,导引头不确定性主要包括闪烁噪声、接收机噪声。通常情况下可视为高斯白噪声[26]。在4.2节的仿真参数基础上,在导引头测量信息中引入均值为0,方差为0.6°/s的白噪声,其值如图14所示。

图14 两种制导律对比验证

与4.2节中参数相同,期望终端交会角分别设为-40°、-60°、-80°,进行数学仿真。图15为CBPNG与本文所提出的NNCBPNG对比仿真的结果。

采用CBPNG得出的终端交会角为-42.53°、-67.20°、-89.11°,采用本文方法得到的终端交会角为-40.36°、-60.85°、-81.16°。由此可见,在终端交会角控制精度方面,相较于传统CBPNG,本文提出的NNCBPNG优势显著。

根据上述仿真分析可知,无论是打击静止、匀速目标或存在系统不确定性的蒙特卡洛仿真,本文基于BP神经网络所设计的制导律相较于传统CBPNG在终端角度的控制精度方面有明显优势,尤其是在前置角较大的大范围机动情况下更为显著,因而可有效地增强导弹的侵彻深度和毁伤效果。另一方面,由于神经网络参数不可避免地占用存储空间,同时还需要一定计算量。本文所使用的BP神经网络规模,存储量在2K以内,在Core i5 PC平台上的计算平均时间(500次)在0.3 ms以内。

5 结论

本研究将神经网络应用在求解CBPNG常数项的问题上。首先,说明公式求解常数项时,存在控制精度较差的问题;其次,通过数学推导证明了b与N、q0、θ0、θf、r0等参数间存在映射关系,并通过灵敏度分析,得到各参数与b的相关性,以此保证所构建样本的均衡性;再次,通过样本策略进行样本建立,得到训练完毕的模型;最后,通过仿真验证说明训练完毕的模型与公式相比精度更高。CBPNG由于模型简单,对工程应用提供了参考,若将训练完毕的模型应用其中,可大大降低计算成本。

然而,本文仅针对纵向平面运动学进行建模与分析,并没有考虑导弹的弹体动力学,这将会使模型在工程应用中的制导精度受到一定的影响,同时,本文仅针对静止目标进行网络训练,仅适用于静止或缓慢运动的目标。因此,在后续研究中将考虑弹体动力学和目标运动等因素。

猜你喜欢
偏置交会制导
基于40%正面偏置碰撞的某车型仿真及结构优化
基于双向线性插值的车道辅助系统障碍避让研究
2019年,水交会来了!
一种偏置型的光纤传导高压电流互感器
基于MPSC和CPN制导方法的协同制导律
基于在线轨迹迭代的自适应再入制导
一级旋流偏置对双旋流杯下游流场的影响
立方体星交会对接和空间飞行演示
带有攻击角约束的无抖振滑模制导律设计
一切以交易的名义——首届黑马创交会揭秘