一种基于最大边际收益的循环否决目标分配方法

文档序号：1963347 发布日期：2021-12-14 浏览：9次 >En<

阅读说明：本技术 一种基于最大边际收益的循环否决目标分配方法 (Cyclic veto target allocation method based on maximum marginal profit ) 是由陈万春陈中原于琦于 2021-08-05 设计创作，主要内容包括：本发明提供了一种基于最大边际收益的循环否决目标分配方法,包括以下步骤：步骤一：建立拦截器对目标拦截概率模型,计算各拦截器对各目标的拦截概率；步骤二：建立高级最大边际收益算法寻优模型,根据各拦截器对各目标的拦截概率,通过寻找武器目标对使指标函数的边界收益最大,从而找到一个性能较优的次优解；步骤三：建立邻域搜索模型,使用循环否决方法进行次优解附近的邻域搜索,提高解的最优性,解决目标分配问题。该方法提高了全局收敛性,在求解最优性上相对于遗传算法等近年来发展的算法均有较大优势,无论是大规模还是小规模的目标分配,本发明得到的次优解都具有相对更高的边际收益。(The invention provides a cyclic veto target allocation method based on maximum marginal profit, which comprises the following steps: the method comprises the following steps: establishing a target interception probability model of the interceptors, and calculating the interception probability of each interceptor to each target; step two: establishing an advanced maximum marginal benefit algorithm optimizing model, and finding out a suboptimal solution with better performance by finding weapon target pairs to maximize the marginal benefit of the index function according to the interception probability of each interceptor to each target; step three: and establishing a neighborhood searching model, and performing neighborhood searching near a suboptimal solution by using a cyclic veto method, so that the optimality of the solution is improved, and the problem of target allocation is solved. The method improves the global convergence, has great advantages in solving optimality compared with algorithms developed in recent years such as genetic algorithms, and the like, and the suboptimal solution obtained by the method has relatively higher marginal benefits no matter large-scale or small-scale target distribution.)

技术领域

本发明涉及一种基于最大边际收益的循环否决目标分配方法，属于目标分配领域。

背景技术

随着诱饵技术的不断发展，对于拦截弹导引头而言，区分真目标和诱饵的任务变得越来越艰难。在导弹识别目标的概率逐渐降低的情况下，传统拦截弹所携带的动能拦截器的拦截效果将大大减弱。为提高大气层外拦截器系统的可靠性，研究人员提出多目标杀伤器的概念，其目的是不再区分空间中的真目标和诱饵，降低了对导引头识别性能的要求。而多目标杀伤器在中末制导交班时，每枚拦截器需要被分配一个特定目标，称为武器目标分配问题。求解武器目标分配问题的目的是能够将武器的性能发挥最大化。目标分配准则一般有对目标群的拦截概率最大、利用更少的武器对目标实现拦截以及保护防御区的残余价值最大等等。

目标分配算法可分为精确算法和启发式方法。解决目标分配的精确算法只有少数几种，主要是因为目标分配问题是一个复杂的NP完备问题，较难求解。对于静态目标分配问题来说，若有m个武器，n个目标，假设武器都必须分配出去的话，可能的分配方案有n^m种。随着武器和目标数量的增加，可能的解决方案将指数级增长，搜索所有的解决方案将面临巨大的计算负担。目标分配精确算法主要为分支定界法，研究人员使用该方法求解了非线性目标分配问题，可找到10枚武器和10个目标的小规模问题最优解，然而，随着问题规模的增大，该方法有可能在7天内无法找到解。为了加快大规模目标分配问题的求解效率，研究人员将非线性目标分配问题转换为一个线性问题，然后利用线性整数规划技术找到最优解。也有学者开发了一个寻找最大收益的武器-目标分配对来求解最优解的算法，利用联合弹药效能手册，规定了每个武器-目标分配对的最小效能，以此来降低搜索范围。

但是，由于目标分配问题的计算复杂性，启发式算法在目标分配问题中得到了越来越广泛的应用，尤其是基于仿生思想的随机优化方法，如蚁群算法、蜂群算法、遗传算法等。遗传算法是一种借用仿生学原理模拟物种进化思想的一种并行计算方法，优点有：由于其编码特性可表示多种问题的可行解、具有良好的群体搜索特性、具有一定的可扩展性等。但遗传算法仍存在部分不足之处：如不易表示优化问题的约束条件；收敛速度过慢且易收敛到局部最优解；且由于其优化结果具有一定的随机性，对于可信度与计算的复杂度的分析并不直观。尽管遗传算法在经过次优解或邻域搜索改进后，寻优效果得到了一定的提升，但由于遗传算法本身的大规模并行搜索特性，使得当种群规模增大时，计算时间急剧增加，当计算时间增大到无法满足实时性计算需求时，需要考虑主要侧重实时性且兼顾求解质量的新目标分配求解算法。

发明内容

(一)发明的目的

本发明的主要目的是提供一种基于最大边际收益的循环否决目标分配方法，可以在较短的时间内获得次优解甚至最优解，提高目标分配问题的求解质量。

(二)技术方案

本发明的主要目的在于提供一种基于最大边际收益的循环否决目标分配方法，以至少解决上述问题。

本发明提供了一种基于最大边际收益的循环否决目标分配方法，包括以下步骤：步骤一：建立拦截器对目标拦截概率模型，计算各拦截器对各目标的拦截概率；步骤二：建立高级最大边际收益算法寻优模型，根据各拦截器对各目标的拦截概率，通过寻找武器目标对使指标函数的边界收益最大，从而找到一个性能较优的次优解；步骤三：建立邻域搜索模型，使用循环否决方法进行次优解附近的邻域搜索，提高解的最优性，解决目标分配问题。

进一步地，拦截器对目标拦截概率模型包括拦截器可靠飞行的概率、拦截器中末制导交班成功的概率和拦截器对目标的零控拦截概率。

进一步地，拦截器中末制导交班成功的概率包括中末制导交班时目标落入末制导导引头视场的概率和实现中末制导交班且末制导导引头成功完成目标检测的概率。

进一步地，拦截器对目标的零控拦截概率主要考虑三个量化指标，包括零控脱靶量、剩余飞行时间和视线角速率，每个指标对零控拦截概率都有着复杂的影响。

进一步地，拦截器对目标拦截概率模型：

其中，P_ij为第i枚拦截器对第j个目标的拦截概率；为第i枚拦截器可靠飞行的概率；为第i枚拦截器中末制导交班成功的概率；为第i枚拦截器对目标的零控拦截概率。

进一步地，拦截器中末制导交班成功的概率：

其中为中末制导交班时目标落入末制导导引头视场的概率；为实现中末制导交班且末制导导引头成功完成目标检测的概率。

进一步地，拦截器对目标的零控拦截概率可定义为：

其中，P_ZEM(i,j)、和分别为零控脱靶量、剩余飞行时间和视线角速率对应的零控拦截概率，β_ZEM、和为权重值，并满足：

进一步地，高级最大边际收益算法寻优模型主要包括最大武器目标对的选择和效益矩阵R的计算。最大武器目标对的选择是从未分配的武器中选取效益矩阵R中元素最大的武器目标对，并将分配矩阵X的相应位置设为1。效益矩阵R中各元素为：

r(i,j)＝p(i,j)v(j)q(j) (5)

其中：p(i,j)和v(j)分别是拦截概率矩阵P和目标威胁权值向量V中的元素，i∈{1,…,m}、j∈{1,…,n}，m和n分别为武器数目和目标数目。其中x(i,j)为分配矩阵X中的元素。

进一步地，循环否决方法是一种启发式的邻域搜索算法，其逐次对利用局部最优思想得到的武器目标分配方案对进行否决，来尝试从新的分配方案中寻找更优解。该方案从局部最优的分配方案开始逐次进行否决且在指标值提升后直接重新开始否决循环以更快地寻找到更优的分配方案。本发明提出的方案与传统的ED元启发邻域搜索方法相比，执行次数更少，最多不会超过拦截器个数m次；本发明提出的方案执行简单，不需要计算指标矩阵，不需要设计阈值来确定否决方案，具有更明显的易操作性；而且本发明提出的方案寻优效率更高。

(三)本发明的优点和功效

应用本发明的技术方案，设计提出了目标分配问题进行快速求解方法，该方法提高了全局收敛性，在求解最优性上相对于遗传算法等近年来发展的算法均有较大优势，无论是大规模还是小规模的目标分配，本发明算法得到的次优解都具有相对更高的边际收益。另外，本发明的算法可以在较短时间内获得次优解甚至最优解，在大规模目标分配问题中，该优势则更为明显，在典型交战条件下可以满足实时性指标要求。

附图说明

图1为高级最大边际收益算法流程图；

图2为循环否决方法流程图；

图3为六枚拦截器对六枚目标的分配结果图。

具体实施方式

下面对本发明提出的一种基于最大边际收益的循环否决目标分配方法做进一步描述如下：

步骤1，建立拦截器对目标拦截概率模型，计算各拦截器对各目标的拦截概率，具体包括步骤1.1至步骤1.3。

步骤1.1，建立中末制导交班偏差模型，计算中末制导交班偏差圆半径，并进一步计算得到目标落入拦截器视场的概率进一步地，设置虚警概率并计算信噪比(S/N)，计算得到实现中末制导交班且末制导导引头成功完成目标检测的概率并更进一步地计算得到中末制导交班成功概率

在完成步骤1.1计算中末制导交班成功概率后，为建立拦截器对目标的零控拦截概率模型，进入步骤1.2，设定零控脱靶量、剩余飞行时间和视线角速率的影响权重值，并根据上述三个指标，采用负指数函数计算三个指标对应的零控拦截概率，进一步地，使用加权法计算拦截器对目标的零控拦截概率

在完成步骤1.2计算拦截器对目标的零控拦截概率后，为建立空间拦截器对目标的拦截概率模型，进入步骤1.3，给定每个拦截器可靠飞行的概率通过将该可靠飞行概率与步骤1.1、步骤1.2中计算得到的中末制导交班成功概率和拦截器对目标的零控拦截概率相乘，可以计算得到空间拦截器对目标的拦截概率P_ij。

在完成步骤1.3计算空间拦截器对目标的拦截概率P_ij后，为求得目标分配次优解，进入步骤2，建立高级最大边际收益算法求解模型，计算效益矩阵R，从未分配的武器中选取矩阵R中元素最大的武器目标对进行分配，并循环直到所有的武器均分配完成后停止，得到目标分配的次优解。

在完成步骤2目标分配的次优解的计算后，为提升结果的最优性，进入步骤3，建立循环否决邻域搜索模型，逐次对利用局部最优思想得到的武器目标分配方案对进行否决，来尝试从新的分配方案中寻找更优解，最终实现武器目标分配问题的快速求解。

为了对本发明有进一步地了解，下面结合图1至图2对本发明的基于最大边际收益的循环否决目标分配方法进行详细说明。

定义垂直于视场平面上,中末制导交班偏差圆半径为：

式中，σ_ir为第i枚拦截器位置误差圆半径；σ_jr为第j个目标的位置误差圆半径；σ_ijq为第j个目标相对于第i枚拦截器的导引头失调角；R_ij为中末制导交班时第j个目标与第i枚拦截器间的相对距离。其中：

式中，σ_irx,σ_iry,σ_irz为第i枚拦截器位置误差分量；σ_irx,σ_iry,σ_irz为第j个目标位置误差分量；为弹目视线高低角；为弹目视线方向角。因此，第j个目标落入第i枚拦截器视场的概率为：

因为导引头对目标的检测概率与给定信噪比S/N要求、导引头帧频和检测时间有关。由于对目标的拦截在大气层外进行，因此不考虑大气的影响，那么信噪比S/N的计算公式为：

其中为目标辐射强度；NEFD_i为第i枚拦截器的导引头噪声等效通量密度。

设虚警概率为则目标检测概率计算如下：

其中σ为导引头检测噪声方差；α为检测信号幅值；T为检测门限；为标准正态分布；f_n为累计检测帧数。只要给定虚警概率便可计算T/σ，再输入f_n与S/N(db)可得目标检测概率

在计算得到目标落入拦截器视场的概率和实现中末制导交班且末制导导引头成功完成目标检测的概率后，中末制导交班成功概率可表示为：

步骤1.2，设定零控脱靶量、剩余飞行时间和视线角速率的影响权重值，并根据上述三个指标，采用负指数函数计算三个指标对应的零控拦截概率，进一步地，使用加权法计算拦截器对目标的零控拦截概率

拦截器对目标的零控拦截概率主要考虑三个量化指标，包括零控脱靶量、剩余飞行时间和视线角速率，每个指标对零控拦截概率都有着复杂的影响。以视线角速率为例，对于一个特定的初始视线角速率，较大的相对距离R_ij对于修正初始的航向角误差是有益的并提高零控拦截概率，但会增大剩余飞行时间。当相对距离R_ij较小时，拦截器可能无法进入碰撞三角形而错过目标。因此，衡量零控拦截概率的三个指标会相互影响。为取得作战效能的最大化，每个指标都需要折中，这也说明了多拦截器要协同作战。在末制导过程中，衡量零控拦截概率的三个指标数值越小，拦截器对目标的零控拦截概率越大。本发明结合三个量化指标，采用负指数函数来定义零控拦截概率。

设定零控脱靶量、剩余飞行时间和视线角速率的影响权重值分别为β_ZEM、和并满足：

通常来说，零控脱靶量是用来衡量拦截器能否命中目标的一个重要指标，也是衡量拦截有效性的重要指标。因此，β_ZEM需要比和稍大一些。

设δZEM、δT_go和分别为零控脱靶量、剩余飞行时间和视线角速率的平均值，各自定义如下：

其中m为拦截器数量，n为目标数量，ZEM(i,j)、T_go(i,j)和分别为第i枚拦截器对第j个目标的零控脱靶量、剩余飞行时间和视线角速率。

设I_a是衡量第i个拦截器是否可拦截第j个目标的中间变量。拦截器轨控当前可开机时间可用来近似，其中m_i为第i个拦截器当前质量，为第i个拦截器当前质量流量，那么则为拦截器当前剩余的机动能力，其中a_max为拦截器轨控可产生的最大加速度。若拦截器剩余的机动能力大于当前时刻零控脱靶量，则认为该目标可拦，拦截概率为零控脱靶量的负指数函数，否则该项为一个小值，即：

在计算得到上述中间变量后，采用负指数函数的形式定义零控脱靶量、剩余飞行时间和视线角速率影响下拦截器的零控拦截概率分别为：

其中和为对应概率的初始默认值。基于上述三个量化指标，使用加权法，拦截器对目标的零控拦截概率可定义为：

步骤1.3，给定每个拦截器可靠飞行的概率通过将该可靠飞行概率与步骤1.1、步骤1.2中计算得到的中末制导交班成功概率和拦截器对目标的零控拦截概率相乘，可以计算得到空间拦截器对目标的拦截概率P_ij。

拦截器可靠飞行的概率可以由可靠性分析的方法获得，但其超出本发明的范围，在本发明中，我们认为拦截器可靠飞行的概率是直接给定的，或者在某一区间内均匀分布。在给定拦截器可靠飞行的概率后，可建立空间拦截器对目标的拦截概率模型为：

其中，P_ij为第i个拦截器对第j个目标的拦截概率。

步骤2，建立高级最大边际收益算法求解模型，计算效益矩阵R，从未分配的武器中选取矩阵R中元素最大的武器目标对进行分配，并循环直到所有的武器均分配完成后停止，得到目标分配的次优解。

高级最大边际收益算法求解模型是通过寻找武器目标对使指标函数的边界收益最大，从而找到一个性能较优的次优解。该算法的求解流程图如图1所示。假设武器数目为m，目标个数为n，拦截概率矩阵设为P∈R^m×n，分配矩阵为X∈R^m×n，目标威胁权值为V∈R^n×1，上述三个矩阵中元素分别为：p(i,j)、x(i,j)和v(j)，其中i∈{1,…,m}、j∈{1,…,n}。

首先设置已分配的武器数目s＝0，并初始化目标分配矩阵为零矩阵。其次计算向量Q，其中元素为：

再计算效益矩阵R，其中元素为：

r(i,j)＝p(i,j)v(j)q(j) (19)

其中v(j)为第j个目标的价值。进一步地，从未分配的武器中选取矩阵R中元素最大的武器目标对，并将分配矩阵X相应位置设为1。最后令已分配武器数目s累加1，判断其与武器数目m之间的大小关系，如果s＝m则求解结束，否则重新计算向量Q，开始下一轮循环迭代。

步骤3，建立循环否决邻域搜索模型，逐次对利用局部最优思想得到的武器目标分配方案对进行否决，来尝试从新的分配方案中寻找更优解，最终实现武器目标分配问题的快速求解。

为避免算法陷入局部最优，本发明将采取邻域搜索策略进一步提高算法的最优性。为提高算法收敛速率，本发明提出了一种循环否决方法进行次优解附近的邻域搜索，即基于最大边际收益的循环否决邻域搜索快速次优分配方法。由于一般次优解的求解算法往往是基于局部最优思想选取某步骤指标值最大的分配方案，故在对次优解进行邻域寻优时，逐次对利用局部最优思想得到的武器目标分配方案对进行否决，来尝试从新的分配方案中寻找更优解。该循环否决方法流程图如图2所示。

首先，将步骤2中得到的次优解分配方案和指标值分别保存为：X₀和f(X₀)。设置中间变量k＝1。将第k轮的分配结果否决的情况下，使用高级最大边际收益算法重新找到次优解，将分配方案和和指标值分别保存为：X₁和f(X₁)。然后比较两种分配方案的指标值f(X₀)和f(X₁)，如果f(X₁)＞f(X₀)，则令X₀＝X₁、f(X₀)＝f(X₁)、k＝1，并重新进行否决寻优；如果f(X₁)≤f(X₀)，则再次判断中间变量k与武器数目m之间的大小关系，如果k＝m，则跳出循环，仿真终止；否则，令k＝k+1，并重新进行否决寻优。

综上所述，本发明的一种基于最大边际收益的循环否决目标分配方法提出了满足实时性的次优目标分配方案，显著提升了拦截器的拦截效果。本发明提出的循环否决方法逐次对利用局部最优思想得到的武器目标分配方案对进行否决，来尝试从新的分配方案中寻找更优解，与传统的ED元启发邻域搜索方法相比，执行次数更少，不需要计算指标矩阵，不需要设计阈值来确定否决方案，具有更明显的易操作性，寻优效率更高。本发明提出的目标分配求解方法与传统的遗传算法和基于测试问题的目标分配算法相比，所得到的次优解都具有相对更高的边际收益。另外，本发明的算法可以在较短时间内获得次优解甚至最优解，在大规模目标分配问题中，该优势则更为明显，在典型交战条件下可以满足实时性指标要求。

实施例

本实施例以六枚拦截器对六枚目标的分配问题验证本发明所提出的方案。假设第i枚拦截器可靠飞行的概率在[0.8,1]间均匀分布；中末制导交班时拦截器位置由惯导和GPS提供，目标位置可由地面雷达提供，假设测量误差均值为零，拦截器位置测量方差为200m，目标位置方差为500m。视线角量测噪声均值为零，方差为1μrad。累计检测帧数为5帧，虚警概率设置为1％，信噪比在3-5之间均匀分布。在拦截器中末制导交班时刻，拦截器的状态和目标的状态分别如下表1和表2所示。

表1拦截器中末交班时状态

表2目标初始位置速度

根据发明步骤1，计算得到第i个拦截器对第j个目标的拦截概率P_ij，并将其写成矩阵形式为：

设定目标的威胁权值V为：

V＝[0.89 0.23 0.85 0.78 0.72 0.88] (21)

根据发明步骤2，计算得到的目标分配的次优解如表3所示：

表3目标分配次优解

对效益矩阵R中的所有元素求和得到该分配方案的效益为3.1808。

根据发明步骤3，计算得到的目标分配的更优解如表4和图3所示，图3中视线上的数字为对应的拦截概率，目标后的数字为相应目标的威胁权值。

表4目标分配更优解

对效益矩阵R中的所有元素求和得到该分配方案的效益为3.2315，总计算时间为0.0049s。

通过该实施例可以看出，本发明提出的算法可以很好地解决武器目标分配问题，经过步骤的循环否决邻域搜索后，方案效益值有明显的提升；且本发明提出的算法计算时间较短，可以满足线上分配使用。

以上所述仅为本发明的优选实施例而已，并不用于限制本发明，对于本领域的技术人员来说，本发明可以有各种更改和变化。凡在本发明的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本发明的保护范围之内。

17页详细技术资料下载

一种基于最大边际收益的循环否决目标分配方法

相关技术

网友询问留言