基于区块链的多先进战机协同作战资源自适应调度

2022-12-25 07:46吴诗平朱荣刚贺建良
南京航空航天大学学报 2022年6期
关键词:协同作战敌方遗传算法

吴诗平,陈 谋,朱荣刚,贺建良

(1.南京航空航天大学自动化学院,南京 211106;2.光电控制技术重点实验室,洛阳 471000)

人工智能、云计算和物联网等技术的发展及其 在军事领域的广泛应用使现代信息化战争逐渐趋于无人化、智能化以及全域化。战机集群作战和协同作战已经成为现代信息化战争的基本作战样式[1],在这样复杂的作战背景下,为了提升多战机协同、集群作战效能,对作战资源调度以及作战信息交互可信性问题进行研究具有重要的意义。

作战资源调度主要根据具体的作战任务合理地分配作战资源,以求整体作战效益最大化,其核心技术是资源调度算法。性能优异的资源调度算法可以在很短的时间内精确地求出最优资源调度方案,这对提高作战效率具有重要意义。狼群算法、蜂群算法、蚁群算法以及遗传算法等群智能优化算法因其优异的寻优性能被广泛地用于求解作战资源调度问题。文献[1]借鉴蚁群算法的优化思想来改进狼群算法,提出了一种寻优性能更好的基于信息素启发的狼群算法,能够有效地解决无人机集群作战的火力分配问题;文献[2]针对防空作战体系中多传感器资源调度问题,对传统蝙蝠算法进行改进,并将其用于求解多传感器多目标分配问题;文献[3]在单亲遗传算法的基础上设计了双亲遗传算法,该算法能够更快、更精准地求出多无人机最优资源调度方案,有效地解决了无人机集群作战的任务分配问题。由于遗传算法在解决资源调度问题方面的优异表现及其算法本身潜在的巨大发展空间吸引了广大学者对其进行改进算法方面的研究,主要改进的方面包括进化概率、进化方式以及染色体种群的初始化等。文献[4‑5]通过设计自适应交叉概率和自适应变异概率来加快算法的收敛速度;文献[6]提出了一种基于“定序模式”的自适应单点交叉方法和随机交换变异方法来改进交叉算子和变异算子,从而在提升了染色体种群多样性的同时增强了算法的寻优能力;文献[7]利用混沌映射法初始化染色体种群,通过丰富初始种群的多样性来提高其寻到最优解的概率。基于以上研究结果,本文利用混沌反向学习法来初始化染色体种群,以精英保留、优劣兼顾的方式改进选择算子,同时采用“优‑中‑差”分层诱导交叉、变异改进交叉算子、变异算子,进而提高了遗传算法的优化性能。

多先进战机最优资源调度方案由多先进战机协同执行,故先进战机间的信任程度势必会影响协同作战的效率。区块链是一种去中心化、分布式的数据存储结构,在多先进战机间建立区块链网络,先进战机间的信息交互在区块链上进行,从而在先进战机间建立了一种完全可信的信息交互环境,实现了作战效能的最大化。区块链和资源调度结合的核心是在智能合约内设计资源调度优化模型,然后智能合约根据发布在区块链上的作战信息自动解算出作战资源调度方案。文献[8]在智能合约内设计了基于协作型协同进化算法的能源电力调度优化模型;文献[9]在智能合约内设计了基于差分进化算法的云制造资源调度优化模型;文献[10]在智能合约内设计了基于Benders 分解算法的边缘服务器资源优化调度模型。

基于以上所述,为了确保多先进战机协同作战信息交互的安全性,同时为了加快算法优化求解多先进战机协同作战资源调度问题的速度,本文在设计基于区块链的多先进战机协同作战资源调度框架的基础上,从交叉、变异方式以及染色体种群初始化等方面对传统遗传算法进行改进,提出了一种基于改进遗传算法的多先进战机协同作战资源调度优化模型,并将其写入智能合约。动态作战环境下改进遗传算法相对于传统遗传算法、粒子群算法等智能优化算法能够以更快的速度求得最优资源调度方案。同时由于区块链下先进战机之间相互完全信任,协同作战的整体效能要高于非区块链下多先进战机协同作战的整体效能。

1 问题描述

1.1 基于区块链的多先进战机协同作战资源调度框架设计

参与作战的我方先进战机群去中心化连接建立区块链网络,各先进战机之间通过共识算法来决定由哪架先进战机产生下一个区块,以这样的方式隔一段时间就产生一个区块,将这些区块按照生成的时间顺序进行连接就形成了区块链。区块链的基本构成单元是区块,每个区块都由区块头和区块体组成,区块头包含父区块哈希值、时间戳以及默克尔树根等信息[9],区块体包含从生成上一区块到当前区块这个时间段内在区块链上发布的作战信息以及根据智能合约解算得出的最优资源调度方案。将改进遗传算法写入智能合约,在智能合约内建立基于改进遗传算法的多先进战机协同作战资源调度优化模型,一旦作战信息在区块链上发布,智能合约便自动解算出当前最优资源调度方案,并将其存储在即将生成的下一区块中。

在t0时刻,区块链上发布初始敌我双方先进战机的作战状态信息,智能合约解算出初始最优资源调度方案,将以上信息打包存入即将生成的编号为k-1 的区块中;在t1时刻,区块链上发布新增敌方先进战机的作战状态信息,智能合约解算出当前最优资源调度方案,将以上信息打包存入即将生成的编号为k的区块中;在t2时刻,区块链上发布新增我方先进战机作战状态信息,智能合约解算出当前最优资源调度方案,将以上信息打包存入即将生成的编号为k+1 的区块中。先进战机群在区块链上发布作战信息的同时也能从区块链上查询得到当前最优资源调度方案,并据此执行作战任务。基于区块链的多先进战机协同作战资源调度框架如图1 所示。

图1 基于区块链的多先进战机协同作战资源调度框架Fig.1 Framework of cooperative combat resource scheduling based on blockchain for multi-advanced fighters

1.2 多先进战机协同作战资源调度建模

在智能合约内建立多先进战机协同作战资源调度优化模型,根据在区块链上发布的敌我双方先进战机的作战状态信息,综合考虑其攻击能力和防御能力,以作战收益最大、代价最小为目标构建多先进战机协同作战资源调度数学模型[11‑12]。将相对空战能力作为衡量双方空战态势的标准,建立空战能力指标体系如图2 所示[13‑14]。

图2 空战能力指标体系Fig.2 Index system of air combat capability

1.2.1 攻击能力

先进战机的攻击能力由先敌发现能力、先敌发射能力以及先敌摧毁能力3 部分构成。正常情况下,先敌发现之后才能先敌发射进而先敌摧毁,构建攻击能力结构如图3 所示[13‑14]。

图3 攻击能力构成Fig.3 Composition of attack capability

由于先敌发现能力、先敌发射能力以及先敌摧毁能力是依次递进的关系,定义攻击能力g1为[13‑14]

式中ψ1、ψ2、ψ3分别为先敌发现能力、先敌发射能力以及先敌摧毁能力。先敌发现能力与敌我战机的相对位置关系以及红外、雷达等探测装备的性能有关;先敌发射能力与探测雷达、中远距雷达弹的性能以及双方战机的相对位置关系有关;先敌摧毁能力与导弹的命中能力、导弹的毁伤能力以及敌我战机间的距离有关。此3 项能力指标的具体数学表达式请参见文献[13‑14]。

1.2.2 防御能力

先进战机的防御能力由隐身能力、通信能力、干扰能力以及机动能力4 部分构成,这四者之间相互独立,没有先后关系,构建防御能力结构如图4所示[13‑14]。

图4 防御能力构成Fig.4 Composition of defense capability

结合上述分析,定义防御能力g2为[13‑14]

式中:χ1、χ2、χ3、χ4分别为隐身能力、通信能力、机动能力以及干扰能力;λ1、λ2、λ3、λ4分别为各项能力权重,且和为1。隐身能力与我方战机的雷达反射截面积以及敌方战机探测雷达的性能有关;通信能力与友机间的距离、无线电台和数据链的可靠性以及无线电台的最大作用距离有关;机动能力与战机最大可用过载、过失速机动能力等机动参数有关;干扰能力与箔条、红外干扰弹的无源干扰以及电子干扰等的有源干扰有关。此4 项能力指标的具体数学表达式请参见文献[13‑14]。

多先进战机协同作战过程中,假设由我方m架战机对抗敌方n架战机,综合上述定义的先进战机攻击能力g1和防御能力g2,则我方第i架先进战机相对敌方第j架先进战机的空战能力g(i,j)为[13‑14]

同理,根据上述建立的先进战机攻击能力、防御能力数学模型,也可以求得敌方第j架战机相对于我方第i架战机的空战能力g′(j,i)。据此,可以得出我方m架战机相对于敌方n架战机的空战能力矩阵G=[g(i,j)]m×n以及敌方n架战机相对我方m架战机的空战能力矩阵G′=[g′(j,i)]n×m。

区块链下和非区块链下多先进战机协同作战资源调度的区别在于区块链下多先进战机间相互完全信任,而非区块链下多先进战机间互不完全信任,先进战机间的相互信任程度会通过影响协同作战信息交互环境来影响多战机协同空战效果,因此结合多先进战机间的相互信任程度,追求作战收益最大、代价最小,设计多先进战机协同作战资源调度目标函数为[15]

式中:式(7)表示对于敌方任何一架战机,都要为之分配至少1 架我方战机与之对抗;式(8)表示我方第i架战机同时对抗的敌方战机的数量上限为Mi。

2 基于改进遗传算法的多先进战机协同作战资源调度优化

针对1.2 节中构建的多先进战机协同作战资源调度数学模型,本文利用改进遗传算法对其进行优化求解[16‑17],建立基于改进遗传算法的多先进战机协同作战资源调度优化模型,并将其部署进智能合约,一旦作战信息在区块链上发布,智能合约便自行根据此信息解算出最优资源调度方案。遗传算法的主要改进内容如下:根据多先进战机协同作战资源调度的特点,本文设计了以敌方先进战机数量为编码长度和我方先进战机数量为基因值上限的实数编码;结合混沌映射法和反向学习法来初始化染色体种群;将父代、子代染色体融合,以精英保留、优劣兼顾的方式来改进选择算子;采用“优‑中‑差”分层诱导交叉、变异来改进交叉算子、变异算子。改进遗传算法的详细步骤如下。

步骤1 染色体编码

假设从区块链上获取的敌我双方参与对抗的先进战机的数量分别为n、m。以敌方战机为参考对象,敌方每架战机都要为之分配1架我方战机与之对抗,因此染色体的编码长度为n。染色体上第i位基因值xi表示对敌方第i架战机,分配我方第xi架战机与之对抗,染色体中每个基因位上的基因值x∈[1,m],且为整数;以n=7、m=4 为例,若某染色体编码为3124134,则表示我方第1 架战机对抗敌方第2 架、第5 架战机,我方第2 架战机对抗敌方第3架战机,我方第3 架战机对抗敌方第1 架、第6 架战机,我方第4架战机对抗敌方第4架、第7架战机。

步骤2 混沌反向学习初始化染色体种群

鉴于混沌映射生成的混沌算子具有很好的随机性,故利用混沌映射法初始化染色体种群能让初始染色体种群在寻优空间随机均匀分布,这样通过提升初始染色体种群的整体多样性来增大寻到最优解的几率。本文采用sine 混沌映射来进行研究,其公式如下

式中:0

鉴于反向学习是在初始解的基础上通过透镜成像原理产生反向解来扩大可选解的范围这一特点,利用反向学习初始化染色体种群能够产生与原染色体种群对立的染色体种群,这样就在原先的基础上扩大了染色体种群的分布区域,增大了寻到最优解的概率。用Xk、X′k依次表示原染色体和经反向学习操作后的反向染色体,由原染色体生成其反向染色体的数学公式如下

将上述生成的染色体种群N1代入式(11)生成数量为snum的反向染色体种群N2。合并N1和N2,以式(5)为目标函数计算各染色体的适应度值,并按照适应度值由高到低进行排序,选择前snum条染色体构成初始染色体种群。

步骤3 选择算子

将经过选择操作后的染色体种群视为父代,该父代经过交叉、变异操作后相对于此父代即为子代。此后每次进行选择操作时,将父代、子代染色体种群组合,按照适应度值由高到低进行排序,为了确保每代中的最优染色体能进入下一代并且新父代染色体种群具有一定的多样性,以优劣兼顾的方式,将前snum/4 条染色体和后snum/4 条染色体直接复制进入新父代,对于中间的3snum/2 条染色体采用轮盘赌算法选取snum/2 条染色体进入新父代。

步骤4 交叉算子

首先根据交叉概率pc对每一条染色体进行评判,将要交叉的染色体加入交配池中,计算交配池中染色体的数量cnum,并将交配池中的染色体按照适应度值由高到低进行排序,将前cnum/4 条染色体视为优秀染色体,中间cnum/2 条染色体视为中等染色体,最末cnum/4 条染色体视为差染色体。差染色体倾向于与中等染色体、优秀染色体交叉来获取较为优秀的基因段,中等染色体倾向于与优秀染色体交叉来获取优秀的基因段,同时优秀染色体、中等染色体以及差染色体在一定程度上也会存在内部(优秀染色体之间、中等染色体之间、差染色体之间)交叉和向下(优秀染色体与中等染色体、差染色体,中等染色体与差染色体)交叉。“优‑中‑差”分层诱导交叉原理如图5 所示。

图5 “优-中-差”分层诱导交叉示意图Fig.5 “Good‑mediocre‑bad”stratified induced crossover

由图5 可见,对于优秀染色体,其与优秀染色体、中等染色体和差染色体交叉的概率依次为p11、p12、p13,且和为1;对于中等染色体,其与优秀染色体、中等染色体和差染色体交叉的概率依次为p21、p22、p23,且和为1;对于差染色体,其与优秀染色体、中等染色体和差染色体交叉的概率依次为p31、p32、p33,且和为1。由此可计算得出,在交配池中优秀染色体与优秀染色体配对的概率为p113,优秀染色体与中等染色体配对的概率为(p12+p21) 3,优秀染色体与差染色体配对的概率为(p13+p31) 3,中等染色体与中等染色体配对的概率为p223,中等染色体与差染色体配对的概率为(p23+p32) 3,差染色体与差染色体配对的概率为p333,且和为1。再按照轮盘赌算法产生所有的配对染色体,并在配对染色体间利用单点交叉法进行交叉操作。

步骤5 变异算子

交叉操作结束后,将snum条染色体按照适应度值的大小由高到低排序,前snum/4 条染色体视为优秀染色体,中间snum/2 条染色体视为中等染色体,后snum/4 条染色体视为差染色体。变异操作分为向上变异、自我突破以及向下变异3种形式。向上变异是染色体朝着比自身优秀的染色体方向变异,随机选取较优秀染色体上的一位或几位基因位,将基因值复制到自身染色体的对应基因位上;自我突破是染色体通过基本位变异的方式来更新自身基因;向下变异是染色体朝着比自身差的染色体方向变异,随机选取较差染色体上一位或几位基因位,将基因值复制到自身染色体的对应基因位上。优秀染色体倾向于自我突破来更新自身基因;中等染色体倾向于向优秀染色体方向变异,在优秀染色体的指导变异下,改善自身染色体的基因质量;差染色体倾向于向优秀染色体、中等染色体方向变异,在优秀染色体、中等染色体的指导变异下,改善自身染色体的基因质量。同时考虑维持染色体种群的多样性,优秀染色体、中等染色体也会有一定的几率向下变异,即优秀染色体朝着中等染色体和差染色体的方向变异、中等染色体朝着差染色体的方向变异。“优‑中‑差”分层诱导变异原理如图6所示。

图6 “优-中-差”分层诱导变异示意图Fig.6 “Good‑mediocre‑bad”stratified induced variation

由图6 可见,对于优秀染色体,其向中等染色体、差染色体方向变异的概率为t12、t13,自我突破的概率为t11,且和为1;对于中等染色体,其向优秀染色体、差染色体方向变异的概率为t21、t23,自我突破的概率为t22,且和为1;对于差染色体,其向中等染色体、优秀染色体方向变异的概率为t32、t31,自我突破的概率为t33,且和为1。

以变异概率pm对每一条染色体进行评判,对要变异的染色体,根据其染色体类型,利用轮盘赌算法确定其将要执行哪种变异方式,再按照上述操作对该染色体进行变异。

步骤6 判断算法终止条件

若算法达到最大迭代次数或者优化解满足预设精度要求,则输出该优化解,即最优多先进战机协同作战资源调度方案,算法退出;否则,转步骤3,继续下一次迭代。

综上,基于改进遗传算法的多先进战机协同作战资源调度优化流程图如下所示。

图7 基于改进遗传算法的多先进战机协同作战资源调度优化流程Fig.7 Optimization process of cooperative combat re‑source scheduling based on improved genetic al‑gorithm for multi-advanced fighters

3 实验分析

为验证本文提出的基于区块链的多先进战机协同作战资源调度方法的有效性,以Windows10为平台,利用python3.8 和matlab2020b 进行混合仿真实验。采用python3.8 为编程语言运行区块链,一旦作战信息在区块链上发布,python3.8 即调用matlab2020b 执行多先进战机协同作战资源调度优化算法生成最优资源调度方案。本文在初始资源调度的基础上,引入敌方新增先进战机这一作战环境动态变化方式对本文所提方法进行仿真验证。

(1)初始作战环境下

同时给出非区块链下我方先进战机P1~P4对友机的平均信任程度为0.7、0.8、0.7、0.8。

基于以上所给数据,选择不同的资源调度算法,分别进行区块链下和非区块链下的多先进战机协同作战资源调度的仿真实验,作战效能Z随迭代次数的变化曲线如图8 所示,初始作战环境下最优资源调度方案如表1 所示。

表1 初始作战环境下最优资源调度方案Table 1 Optimal resource scheduling scheme in initial operational environment

图8 初始作战环境下作战效能随迭代次数的变化Fig.8 Combat effectiveness changing with the number of it‑erations in initial combat environment

由图8 可见,对于同一仿真场景,改进遗传算法相对于传统遗传算法、传统狼群算法以及传统粒子群算法能以更少的迭代次数寻到最优解,证明了改进遗传算法性能的优越性。资源调度结束后,区块链下、非区块链下的作战效能分别为3.174、2.372。由于在非区块链下,先进战机之间相互不信任,进而间接降低了协同执行资源调度方案的效率,从而降低了协同作战的整体效能。

由表1 可见,初始作战环境下的最优资源调度方案为:我方先进战机P1对抗敌方先进战机T4和T5,我方战机P2对抗敌方战机T1,我方P3对抗敌方T2和T6,我方T4对抗敌方T3。

(2)敌方新增两架先进战机T7、T8

结合以上数据,选择不同的资源调度算法,分别进行区块链下和非区块链下的资源调度仿真,作战效能Z随迭代次数的变化曲线如图9 所示,当前作战环境下最优资源调度方案如表2 所示。

表2 当前作战环境下最优资源调度方案Table 2 Optimal resource scheduling scheme under cur⁃rent operational environment

图9 当前作战环境下作战效能随迭代次数的变化曲线Fig.9 Combat effectiveness changing with the number of iterations under current operational environment

由图9 可见,区块链下、非区块链下的作战效能分别为3.736、2.876,同样由于先进战机之间相互不信任导致区块链下的作战效能要高于非区块链下的作战效能。

由表2 可见,当前作战环境下的最优资源调度方案为:我方先进战机P1对抗敌方先进战机T2和T4,我方战机P2对抗敌方战机T1和T8,我方T3对抗敌方T6和T7,我方T4对抗敌方T3和T5。

4 结 论

为了确保动态作战环境下多先进战机协同作战信息交互的安全性以及加快算法求解资源调度问题的速度,本文提出了一种基于区块链的多先进战机协同作战资源自适应调度方法。通过设计基于区块链的多先进战机协同作战资源调度框架来建立完全可信的信息交互环境,同时在考虑先进战机攻击能力和防御能力的基础上,以作战收益最大、代价最小为目标建立了多先进战机协同作战资源调度优化模型,并用改进遗传算法对该优化问题进行求解。由仿真结果可见,改进遗传算法相对于传统遗传算法、传统狼群算法以及传统粒子群算法能够以更快的速度求得最优资源调度方案;区块链下先进战机之间相互完全信任,使得其协同作战效能要高于非区块链下的协同作战效能。

猜你喜欢
协同作战敌方遗传算法
少林韦陀十八手
4打5,敌方还剩几个人?
穿越火线之协同作战(下)
基于改进TOPSIS有人/无人机协同作战效能评估
基于遗传算法的高精度事故重建与损伤分析
基于遗传算法的模糊控制在过热汽温控制系统优化中的应用
基于遗传算法的智能交通灯控制研究
水果大作战
人工智能有助于处置敌方炸弹
媒体融合背景下体育报道的制胜之道