一种新的基于LSTM的航位推算算法*

2023-12-11 12:10涂杰黎杰刘凯

舰船电子工程 2023年9期

涂杰黎杰刘凯

（1.中国人民解放军92246部队上海 200000）（2.海军航空大学烟台 264001）

1 引言

在分布式交互仿真中，仿真实体需要在网络中及时发布信息，以保证各仿真节点中所存储实体的一致性、连续性和平滑性。在网络带宽有限和实体数量较多的情况下，必须要采用一定的技术手段，一方面保证仿真过程中信息连贯性，仿真实体运动的平滑性和连续性，另一方面尽量降低对网络带宽带来的消耗。航位推算（DR）算法是目前最常采用的一种技术，该算法通过对实体运行进行预测来减少信息的传输量，降低网络带宽需求。

目前DR 算法是基于实体运动物理量，结合固定运动模型，完成对仿真实体运动状态的推测，当推测出的仿真实体运动状态与实际仿真实体运动状态的误差超出阈值时，则进行相应的误差补偿，从而在保持仿真实体运动平滑性和连续性的前提下，降低对通信资源的消耗［1］。然而，抽象出的固定运动模型难以对仿真实体的复杂的运动状态进行精确推测，制约着DR 算法的整体性能。深度学习技术可以在目标函数的引导下，基于深度神经网络实现对任意复杂函数的拟合，从而为我们持续更新运动模型，提升模型推算精度，提供了新的思路。

2 DR算法

DR 算法通过对仿真实体运动信息的预测，减少仿真过程中的信息传输资源开销［2］。DR 算法的基本原理是，根据仿真实体的运动特征，抽象出简化的运动模型，并设置阈值；利用抽象出的运动模型，根据最近一次发布的仿真实体运动信息，对仿真实体的运动状态进行预测；如果推测出的仿真实体运动信息与发布的真实信息的误差在阈值范围内，则不进行信息推送，如果超出阈值，则需要进行信息传输，对推测的运动信息进行补偿；在信息推送的间隙，则通过仿真实体最后接受的信息和抽象出的运动模型对仿真实体运动状态进行推测［3～5］。

DR 算法的研究主要集中在，构建仿真实体的运动预测模型和对如何设置阈值的研究。对于仿真实体运动预测模型的研究，主要做法是在对仿真实体运动模型分析的基础上进行抽象简化，进而抽取出有限个运动模式，如匀速直线运动、加减速运动、转弯等。在实际应用中，通过对运动模式的排列组合，以及接收到的仿真实体的最后运动信息，实现对仿真实体运动状态的预测。基于简化运动模式组合的推测模型构建方法，会增加推测值与真实值的偏差，并且随着对仿真粒度的细化，会使仿真过程中通信资源的开销大幅增加，严重影响仿真过程中，仿真实体运动的平滑性和连续性。以计算资源为代价来降低通信资源开销是DR算法的核心机理，克服仿真实体高精度模型的构建困难，提供更为准确的仿真实体运动信息推测模型，对DR 算法的效能提升具有重要意义。

图1 DR算法原理图

3 基于循环神经网络的DR算法优化

在仿真过程中，为了降低对通信资源的开销，同时使仿真实体的运动状态保持良好的平滑性和连续性，采用了DR 算法。然而传统的仿真实体运动推测模型的构建方式，不能对仿真实体的运动特性进行精确描述，并且大多数仿真实体的运动特性复杂，直接进行高精度的运动模型构建难度较大。传统方式中，通过仿真引擎得出的真实数据仅能对推测模型得出的数据进行补偿修正，却无法在补偿的同时利用差值对整个模型进行更新，使其获得更优的预测性能，进而无法提升对仿真实体运动状态的预测性能，进一步降低通信数据量，减轻对通信资源的消耗。

深度神经网络具有极强的表示能力，能够在数据的驱动下，通过监督学习的方式，以实际输出值和期望值之间的误差为引导，对难以用公式进行描述的模型进行拟合，并依据所拟合的模型能够对未知状态进行预测。由于仿真实体的运动状态信息前后紧密相关，所以本文采用深度学习领域中能够处理序列信息的经典神经网络，循环神经网络（Recurrent Neural Network，RNN）［6～7］。朴素的循环神经网络能够处理的数据长度是有限的，较长的数据序列很容易产生梯度爆炸和梯度消失，为了能更好地处理较长的数据序列，可以使用改进后的循环神经网络，长短时记忆网络（Long Short Term Memory Network，LSTM）及其相关变体［8～9，20］。

3.1 长短时记忆网络

LSTM 是循环神经网络的一个重要发展成果［16～17］，该网络通过增加一个传输状态c，实现了对长序列的更好处理。典型的LSTM 设置有遗忘门ft、输入门it和输出门ot［18～19］，传输状态c通过遗忘门ft和输入门it，能够对序列数据进行选择性保留［10，14］。黑色方框内的wf、vf、wi、vi、wg、vgwo、vo被称为权重系数，对序列数据的保留程度由wf和vf调控，对当前数据的保留程度由wi、vi、wg、vg调控，当前的输出则由处理后的历史数据和wo、vo调控。对于各黑色加粗方框内的权重系数矩阵，由预测仿真实体运动状态和真实运动状态之间的误差进行反向传播，并采用梯度下降的方式进行更新，以提升模型的预测精度［11，15］。LSTM的公式表示如下：

3.2 LSTM-DR算法

在LSTM-DR 算法中，仿真实体运动状态预测模型不再是一成不变的，而是利用预测运动状态与真实运动状态之间的误差，持续不断地的向误差减小的方向对模型进行更新，从而不断提升模型的预测精度，减少对运动状态信息进行通信的需求。

图2 LSTM算法原理图

具体的算法流程如图3所示。在仿真过程中，仿真引擎每推进一个步长，将仿真实体t 时刻的运动状态数据St被分发给相应的仿真实体，t 时刻之前的运动状态信息被LSTM 算法进行选择性的录入，作为当前模型输出的依据。

4 仿真实验

4.1 实验设置及结果

为验证第3 节提出的LSTM-DR 算法，设置仿真实验的想定如下，在二维平面内假设舰艇以20海里/h 的速度，航向北偏东30°航行30min，进而增速至25 海里/h 航行30min，然后转向正东方向同时加速为30 海里/h 行驶30min。得到的实验结果如图4所示。

图4 仿真实体运动状态信息图

从图4 中可以看出，在仿真初期，基于LSTMDR算法的运动模型推算出的舰艇运动状态与实际状态有一定差距；第一次舰船运动状态发生变化时，运动模型推测出的结果与真实结果仍在一条航迹上，但是位置上有些滞后；第二次舰船运动状态发生了航向和速度两种变化，在状态改变的初始阶段运动模型的估计精度下降；第二次运动仿真实体运动模型的精度恢复时间要长于第一次仿真实体运动状态改变时，运动模型推测精度的恢复时间，但是要短于仿真初期模型估计精度的提升时间；仿真实体运动状态持续时间间隔内，运动模型推测的运动状态几乎与发布的仿真实体真实运动状态完全一致，推测精度高，完全满足仿真实体运动平滑性和连续性的要求，在这一时间段内几乎没有对仿真实体运动信息的通信需求。

4.2 实验结果分析及结论

对于4.1 节得出的实验结果，仿真实体运动初始和运动状态发生急剧变化时，运动状态推算模型的估计精度不高，是因为基于LSTM-DR 算法的模型需要进行训练，即利用真实数据与推测数据间的误差不断对模型的权重数据进行反向更新，模型才能达到良好的估计精度。仿真实体运动推测模型运动状态改变的激烈程度增大则模型训练需要的时间延长，如第二次运动状态改变，运动模型的精度恢复时间长于第一次仿真实体运动状态改变时的模型精度恢复时间，但是短于仿真初始阶段的模型精度提升时间。这是知识迁移效果所致，深度神经网络对训练得到的知识以权重参数的形式保留，在运动状态变化不激烈的情况下，利用原有的保留知识仍能在一定精度上对仿真实体运动状态进行估计，并且仅需要少量训练就可以针对当前运动状态恢复到原有的估计精度，随着运动状态变化激烈程度的增加，模型需要的训练量则同步增加。

根据上述分析，可以得出如下结论，一是提出的LSTM-DR算法能够利用误差对仿真实体运动状态推算模型进行更新，以达到更高的推算精度；二是在仿真实体运动之初以及运动状态发生重大变化时，需要真实运动信息数据以尽快提升模型精度，然而在运动状态不发生重大变化的较长时间间隔内，仿真实体运动模型可以进行高精度的运动状态推测，几乎不需要进行任何运动信息推送，通信资源需求大幅降低；三是在运动状态发生变化时，仿真实体运动状态推测模型的训练时间与运动状态的变化剧烈程度相关。

5 结语

仿真技术是主要是为了实现对真实物理世界的逼近模拟，而深度神经网络对模型具有强大的拟合能力［12］，两者的结合必然能够促进仿真技术新的发展［13］。文中所提出LSTM-DR 算法，利用LSTM对仿真实体运动模型进行构建，相较于传统的简单运动模式组合的模型构建方式，能够对仿真实体复杂运动特性进行更加精确地描述，实现对运动状态的高精度推算，从而在保证仿真实体良好的运动连续性和平滑性的基础上，降低对通信资源消耗。