难分类样本快速空中目标意图识别方法

2024-02-23 09:14张杰勇杨富平

空军工程大学学报 2024年1期

赵亮, 孙鹏, 张杰勇, 钟赟, 杨富平

(1.空军工程大学信息与导航学院,西安,710077;2. 94587部队,江苏连云港,222345)

空中战场环境复杂、瞬息万变,数据处理的速度尤为重要,基于同一场地的攻击态势变化复杂,除关键几帧的动作变化,大量的飞行意图较为接近,造成捕获数据高度相似。因此单纯依靠人的经验和传统方法提取相似特征,难以满足指挥员及时准确决策的要求,也会影响对现有武器系统快速精准的反应。因此,需要设计一种能够快速及时准确识别敌方空中群组意图的方法,从而辅助指挥员决策制定。

江苏省“十二五”结转“十三五”的城际铁路项目总共2个，分别为连淮扬镇铁路和徐宿淮盐铁路。其建设里程为621 km，总投资为866亿元，资本金总额为433亿元。根据路省商定比例，江苏省方(包含省级、市县)需投入资本金187亿元。

燃油蒸汽发生器由供水口、水位计、烟囱、压力表、压力开关、控制器、燃烧器和排污口等部分组成。其结构及各部分如图3所示。

国内外的研究中,用于目标意图识别[1]的方法主要有传统数学模型如专家系统[2-3]、贝叶斯网络[4-6]、灰色关联区间度[7]、模板匹配[8-9]、决策树法[10]、证据网络[11]、随机森林[12]等,相对应的机器学习神经网络等方法[13-17]也有许多研究者进行了探索。传统数学模型需根据场景进行精准建模,模型适配更体现当前的参数设置和经验知识的评估,对相关领域的专业知识整合要求较高,难度较大;同时,更换新的参数或移植到新的场景往往需二次建模重新评估,模型调整较大,可移植性难以保证。基于神经网络的方法,更依赖数据特征的提取捕捉,迁移至不同数据集或新场景的效果普遍较好,因此本文将延续神经网络的方法进行研究。

现有使用神经网络的方法均是在训练集各类别相对平衡以及数据相似度不高的情况下进行。不平衡问题[18]是分类问题的一种,出现在日常生活的各个方面,是机器学习数据挖掘等领域不可缺失的一部分,只有通过正确的数据分类后,才能通过相关算法挖掘信息的潜在价值。

真实战场数据不仅存在着样本集数量的不平衡,同一战场环境的不同意图样本数据也有较高相似性,往往各类不同意图的数据在数据特征上表现为特征相似、数据的重叠区间较大。特别是从针对现有神经网络方法的仿真训练结果可以看出随着样本数量的递减,训练效果不稳定,呈现较为直观的下降趋势,即现有模型更多依赖于数据量的积累。其中,对于不平衡数据下的相似样本更是不能很好地提取特征。同时,对现有模型而言,随着数据预处理过程中数据量的扩充,伴随而来的是更大计算量和更长的训练时间。难以同时平衡消耗的内存空间或时间。

针对以上问题,本文提出2点解决方法:一是采用滑窗估计的方式进行样本数据的扩充,解决不平衡难分类数据的扩充问题;二是提出使用TCN-Self Attention模型替代现有机器学习进行空中群组意图识别的模型。

1 目标意图识别问题

本文通过空中群组特征数据集训练TCN-Attention网络,使得网络能利用群组的时序特征状态识别出群组意图,完整流程如图1所示。

图 1空中群组意图识别流程

1.1 意图识别定义

意图识别[1]指通过对我方各类战场信息源、传感器等所获得的地方信息,进行综合分析,从而合理地判断、预测或解释敌方目前的作战行动意图。意图类型与时间、地点、环境、任务、规模等因素紧密关联。不同的作战意图应用的作战场景也不同。对敌方目标战术意图的识别,是从动态变化的战场态势数据中持续捕捉、抽取与敌方目标及相应时空域内战场环境信息、分析并推断敌方目标战术意图的过程。

1.2 目标群组意图判别机动特征描述

其次，一到“双十一”，大学生之间的互动语就变成了“你剁手了吗？”、“有没有抢到？”、“秒没！”、“接下来的日子我要吃土了。”等等；在“双十一”结束之后，接踵而至的一个环节就是晒单，届时，大家纷纷在QQ空间，微信朋友圈，微博等社交平台上晒出自己的“掠夺成果”。所以可以看出，大学生的消费选择在群体内部相互影响，不断循环，最终在购买行为中显现出来。

目标作战意图的不同往往体现在飞行目标的机动动作或飞行状态,即意图与机动动作或状态之间存在某种关联。从作战实际的角度出发,当敌方战机具体参与某项作战任务时,其战机的某些特征信息必须满足一定的条件。而意图的判别往往可以转化为机动动作或飞行状态的识别。机动动作或飞行状态的识别又可进一步化为对雷达数据量测和飞行特征的捕捉。

图2 数据特征空间

图2为每条飞行记录的数据结构。本文选取的数据为一组动态的时序过程,将连续12帧雷达量测和同一时刻相对应的飞行数据封装为1次飞行记录,即每条飞行记录有12帧飞行片段;每帧飞行片段包含9维数据特征,即每条飞行记录包含108个数据。

2 样本数据预先处理

战场态势瞬息万变,真实战场环境下样本首先呈现不平衡特性;其次,受到地理位置、天气等环境外因制约,同一区域的战术行动在一定数据量的积累下会展现出一定的规律。敌方为更好地完成后续战术行动,飞行动作也会更加复杂。因此在实际测量过程中,不同标签意图的数据呈现高度相似性,对模型而言,即表现为难以对数据分类。

本文数据来自某仿真平台,表1为各类数据意图占比,所用的数据前期已通过领域专家完成了飞行意图的判断并通过计算机完成对数据的意图标记见图3。

3)刚度和屈服极限随贮藏时间的延长呈逐渐下降趋势，变形能则随贮藏时间延长呈逐渐上升趋势。破裂极限和破坏能在贮藏最后3天达到最大值。

表1 数据各意图占比

为了更好地分析样本特征,将对空、对海雷达的数据情况进行统计,攻击、电子干扰、佯攻意图时需要常态开启雷达,而撤退、侦察、监视意图时可能需要选择性开闭雷达。

(a)数据高度分布情况

(b)数据意图位置分布情况

2.1 数据预处理步骤

数据预处理一方面是将原始数据进行格式转化,使得原始数据满足可以输入到神经网络的数据形式。另一方面,对于原始数据而言,不同标签数据的高度相似对模型的特征提取收效甚微。通过少量难分类数据的微小变化,也在一定程度上启发式地促进后续模型的特征捕捉,从而促进模型性能提升。更好地达到模型识别的效果。结构见图4。

图4 数据预处理步骤

滑动窗口估计[19]作为一种对时间序列进行在线估计和预测的有效方法,其参数设置需要综合考虑多方面因素。通过不断验证各项参数的配比,反复实验对比,最终确定所使用的最佳参数:滑窗大小为3,滑窗步长为1,采样长度间隔不大于5。

2.2 难分类样本处理方法

本文采用更换原始时空卷积网络(temporal convolutional network,TCN)结构中的激活函数实现难分类数据的非线性化,以此实现样本的特征变化,进一步方便模型的分类训练,原始TCN网络模型使用ReLu作为激活函数,其特点是速度快,但会将负值样本信息归零,造成部分归零的隐藏节点失活。为此本文引入Leakey-ReLu、Tanh、Sigmoid激活函数进行组合,用以代替模型原始结构中的3次ReLu。

滑窗估计公式如下:

(1)

win()为滑窗估计函数,mind()为取中位数的操作,wj为经过滑窗估计后得到的数据,Δd为最终得到的采样间隔。当采样序列有n个采样点x1,x2,…,xn那么采样点之间会产生n-1个采样间隔dj=xi-xi-1,i∈[2,3,…,n],根据实际应用需要可自行确定使用k次滑窗估计产生估计值,并且对估计值排序后取中位数,作为新与旧点最后一帧之间的估计间隔。

2.3 意图编码

保险截止日期可能很多网友都记不住，各种原因导致保险过期的事经常听说，更有甚者连必须给车上交强险这事都不知道。车辆在保险过期情况下上道行驶，视为无保险车辆，被警察查到交强险过期，将按保费双倍罚款，补上交强险，并扣留车辆。

膨胀卷积的采样间隔满足如下公式:dilation=2level-1,TCN网络通过较少的层数捕获较大的感受野,也能够方便进一步数据特征的提取。

3 TCN-Self Attention空中目标意图识别模型

在真实空中群组目标意图识别环境中,模型的训练时长和内存资源消耗对现实平台的设计搭建运用影响较大,因此是模型的时间空间消耗评估中最需考虑的关键指标。为此,本文引入添加注意力机制的TCN时空卷积网络。

3.1 TCN-Self Attention隐藏层结构

3.1.1 TCN结构

在课堂教学过程中引入情境教学，教师就可以与学生进行情感上的沟通交流，不仅可以激发学生的学习兴趣，还能够满足学生的学习需求。在小学体育课堂教学中构建生活化的教学情境，可以帮助教师更好的完成教学任务。对于学生而言，可以将生动抽象的体育知识转换为形象丰富的内容和技能，促使学生加深对体育知识或者技能的理解和记忆，促使学生养成良好的体育运动习惯，促使自身全面发展。

为了提高意图识别模型对数据信息的利用效率,引入了TCN(时空卷积网络)模型,文献[21]证明了在不同通用数据集条件下(含通用序列数据集条件如:MNIST、Adding problem、Copy memory、Music JSB、Music Nottingham、PTB、Wiki-103、LAMBADA、text8),TCN网络效果要明显好于传统针对RNN及其衍生应用于处理序列问题的神经网络。

空中目标群组规模平均2～5架次,当敌方飞行小队来袭时,优先查找该小队最具特征的一组或几组特征群组用以代替敌方目标小队整体。

TCN模型使用膨胀卷积网络[20],相对于传统卷积神经网络而言,膨胀卷积网络拥有更大的感受野,能更好地提高模型对于输入数据的特征提取。计算公式如下:

predictlabelj=Softmax(Lj),j∈[1,2,…,label]

(2)

膨胀卷积核的尺寸:

这张照片对色彩和层次的把控非常棒！天空在日出日落的时候颜色变化最为丰富，此时因为色温以及云朵的阴阳面问题，很难让颜色既丰富又不过分。作者很好地平衡了照片中不同暖色调的呈现效果，尤其是对紫色区域和橙色区域的把控。我建议作者后期还可以对地面上的水进行一些提亮，并选择性锐化和增强山体，甚至可以给这里增加一点点冷色调，这样照片表现力更强。总而言之，这张作品在还原色彩的同时，让各个色彩搭配得非常和谐，看得出作者对颜色的驾驭和思考都比较到位。

kernel′=(dilation-1)×(kernel-1)+kernel

(3)

式中:input为卷积运算的输入尺寸;output为卷积运算的输出尺寸;kernel是卷积核的尺寸;表示向下取整;kernel′为膨胀卷积核的等效尺寸;dilation为膨胀卷积间隔。膨胀卷积运算输出尺寸只需将kernel′带入公式即可。

本文最终确定意图共计6类{攻击、撤退、电子干扰、监视、侦察、佯攻},前期经过领域专家对数据展现的飞行动作进行判别以及计算机数据标记,完成6类飞行意图评判。由于该6类意图不能直接作为神经网络的评判依据,因而本文对6类目标行为对应编码为{0, 1, 2, 3, 4, 5}。

图5 TCN网络结构

3.1.2 Self-Attention自注意力机制

式中:Wi、bi为线性层需要训练的网络参数;Linears(Yi)为整体隐藏层的输出;label为分类标签的个数;epoch为每批次读取的数据个数。

岩样采用薄壁金刚石钻头沿垂直于岩层方向钻取岩芯，经过锯、磨加工成直径为50 mm，高为100 mm，试样两端面不平行度不大于0.05 mm，满足《规程》要求，60组共计180个试样，制备部分试样，如图2所示，其中顶板岩石用A编号，底板岩石用B编号。试验在RMT-150B型电液伺服岩石力学试验系统进行单轴压缩试验，如图3所示。轴向荷载采用1 000 kN力传感器测量，轴向压缩变形采用5.0 mm位移传感器测量，变形精度为1.0×10-3 mm，采用位移控制方式，加载速率为0.002 mm/s，每组岩性重复进行3次试验。煤层顶底板岩石单轴压缩试验结果见表1。

做好市场拓展，提升品牌价值。积极关注市场变化，研究消费需求，找到客户需求的“痛点”，不断提升市场占有率。2015年在行业内率先开发出混合胶，受到市场推崇；2016年又率先推出颗粒型混合胶。与此同时，海外生产的产品用塑料托盘替代木制托盘，提升了客户满意度。尽管广垦橡胶产品推出时间仅10余年，但在中国市场的接受度、占有率、流通性节节攀升，目前已经与业内老牌的诗董、联益、宏曼丽并列。

计算式如下:

Yi=soft max(DiQi(DiKi)T)DiVi

(4)

式中:Di为经过TCN膨胀卷积后的第TCN个数据输出,Qi,Ki,Vi为Di输入相关的参数矩阵(Q:Query,K:Key,V:Value),Yi为经过Self-Attention层的输出结果(其中i∈[1,2,…,epoch])

3.1.3 全连接层结构

通过全连接结构将注意力层的输出节点缩小至输出节点的数量,并完成权重的配置和Softmax函数的输入格式整理。公式为:

Lj=Linears(Yi)=WiYi+bi,

j∈[1,2,…,label],i∈[1,2,…,epoch]

全金属有效力矩紧固件通过有意设计的紧固件扭曲或变形来形成螺纹接合面。例如，图5(b)中自锁螺母顶部有一个弹簧板，该弹簧板压在螺纹上，使螺母很难松开，拆卸后，这种螺母仍可再次使用。图 4中的7有螺纹剖面变形式有效力矩型螺栓，顾名思义是螺纹拧紧时变形而产生防松阻力。尼龙接合面有效力矩紧固件在紧固件螺纹上采用了尼龙材料来形成螺纹接合面。

(5)

为了使TCN网络能够更好地捕捉数据特征关键信息,提高模型分类识别性能,本文在TCN网络的隐藏层和全连接层之间引入自注意力机制Self-Attention,使用乘性模型,通过训练优化注意力层的权重分布,最后经过加权汇总得到最终输出向量。

3.2 输出层结构

将Self-Attention层的输出作为本层的输入,隐藏层的数据通过Softmax函数对上一层的输出进行归一化,转化为分类标签的概率向量,进而依据概率向量对特征数据进行意图识别分类,公式为:

卷积层的输出尺寸:

(6)

4 实验分析

本实验延用第2节数据。采用基于Annocada平台的python语言,神经网络学习框架为Pytorch,运行环境为pycharm2021,win10。显卡为RTX1060Ti,16GB内存,引入模型运行时占用的内存空间、运行速度和时间进行对比。

4.1 基于滑窗估计下TCN-Self Attention模型的消融实验分析

本文在分析数据分类的准确性时,主要用到4个评价指标,分别是准确率、查准率、查全率、以及F1-score作为分析指标,结果如表2和表3所示。

表3 各模型数据整体识别准确率 %

4.2 TCN-Self Attention同往期模型结果对比

为验证本文模型结果的优越性,将本文所提的TCN-Self Attention模型分别与文献[8]中SAE网络、文献[12]中DNN网络、文献[15]中BiGRU+Attention网络文献[16] DNN-AG以及文献[17]AT-TCNBiGRU共同进行对比实验。

4.2.1 各模型精确性对比

1.3.1 学生意见反馈。制作学生意见反馈调查表，对两组教学效果问卷调查，包括：课堂情况、知识运用情况、能力培养情况3大方面进行评分，最低0分，最高10分。

为了更好展现本实验所用模型的效果,我们将不同模型所用的参数进行统一。在模型的调试仿真阶段。对每个参与对比实验的模型均做到尽可能的参数调优;进行不同模型的准确率、运算时间、内存消耗结果对比。表4仅列举不同模型之间共同的一些结构参数。

此外本文模型对原TCN的激活函数有一定改进。在原Relu的基础上引入Leakey-Relu、tanh、sigmoid激活函数,因此本文模型每层待选的3个激活函数位相互可组合产生64种方案,表5仅列举基于本实验数据集和参数条件下结果靠前的5种激活函数组合。通过多次运行记录各组合下的平均最优值。

表4 对比实验的模型参数

表5 不同激活函数的最优组合结果

图6和图7为TCN-Self Attention(浅蓝曲线)与现有意图识别模型基于本文实验数据条件下准确率对照结果。TCN-Self Attention在分类准确度方面对以往模型均有更好的表现,其中针对以上传统模型提升效率,如表6所示。本节的对比实验中TCN-Self Attention使用激活函数为第3组合leakey+tanh+tanh。因为相比于准确率排名第1的tanh+tanh+Relu组合和排名第2的tanh+leakey+Relu组合,第3组激活函数生成曲线更加平滑且模型训练结果更快速更稳定。

图6 模型准确率与数据量变化关系

图7 模型准确率与时间的变化关系

表6 模型运算准确率对比

4.2.2 模型计算复杂度分析

这个时期火星表面的水持续活动着，形成了我们现在看到的各种河谷网络和沉积岩记录。火星内部的地磁发动机在前5亿年里经历了从活动到停滞的全过程，之后，火星失去了地磁场的保护，也失去了它原生的大气。如果火星曾经出现生命，最有可能就是在这个时期。所以要类比这个时期的火星，科学家们寻找存在水-岩石-生物相互作用的地区，还有存在地球早期生命遗迹的地方。

表7为模型计算复杂度对比,实际运行时间以及内存消耗对比基本一致。因此,综合以上运行时间、运行内存消耗以及复杂度估计结果对比,可以认定TCN-Self Attention在准确率、时间效率以及空间资源消耗方面整体表现出较为完善的效果。

3.建立信息的流转机制与查询制度。从总体上看，信息的流转是信息利用的特殊方式，是信息效能发挥最大化的基本要求。但是，职务犯罪的信息流转与公安机关的普通刑事犯罪信息流转不同。信息作用的发挥需要流转，但流转过程中发挥作用的基本方式是需要信息的便捷查询。为此，需要对现有的信息分级查询权限和规范进行总结。此外，由于信息研判功能的相对独立，需要对信息研判单位的职责定位清晰，一方面它应当主动进行信息的研判，为功能对口单位提供信息支持，另一方面应当要求其对于业务部门的定向信息研判作出必须的响应。

表7 模型计算复杂度对比

5 结语

本文针对空中目标群组数据量不平衡问题下的难分类数据意图识别模型进行了改进。提出了先扩充训练集中的不平衡难分类数据量,根据滑动窗口方法扩充了样本空间中的少数难分类样本数量。随后在识别过程中引入TCN网络及Self Attention机制对扩充后的样本信息进行更深层次的特征捕捉,进而提升模型意图识别的效果。最终仿真结果也表明,滑动窗口方法能够在不平衡样本的难分类数据扩充时有效保留更多原有样本细节,同时TCN-Self Attention模型也在不平衡样本的难分类数据空中目标群组意图识别问题上有更高的训练效率和更精准的分类效果。

然而,本文所采用的目标飞行数据集是在受控的实验条件下获得,无法充分反映实战环境的复杂性。实际作战场景中目标的飞行轨迹和活动模式会受到诸多不确定因素的影响,如天气环境、地形掩护、电子干扰等,目标也可能采用欺骗机动对抗识别。这将影响目标意图识别算法的性能。此外,现有数据集规模有限,无法充分包含各种复杂情景,也可能制约了算法的泛化性。综上,我们将在后续工作中构建更加丰富多样、包含复杂飞行情景的目标意图数据集,以提高研究的适用性。