一种基于行为的多uuv自组织协调控制方法

文档序号：1658227 发布日期：2019-12-27 浏览：7次 >En<

阅读说明：本技术 一种基于行为的多uuv自组织协调控制方法 (Behavior-based multi-UUV self-organizing coordination control method ) 是由梁洪涛强宁于 2018-06-20 设计创作，主要内容包括：本发明涉及一种基于行为的多UUV自组织协调控制方法,包括：步骤1：构建免疫网络与多UUV系统之间的映射关系,并定义相关参数；步骤2：提出基于基本行为动作的协调控制动力学模型,并且实现作业环境误差的分数布朗运动建模；步骤3:给出了离散状态的基于免疫网络的多UUV自组织协调控制,满足分布式结构下多UUV系统的协同控制,实现对敌方目标的围捕作业；本方法具有强大的自组织性、容错性、实时性等特点,而且便于水下无人系统的工程实现。(The invention relates to a behavior-based multi-UUV self-organizing coordination control method, which comprises the following steps: step 1: constructing a mapping relation between an immune network and a multi-UUV system, and defining related parameters; step 2: a coordination control dynamics model based on basic behavior and action is provided, and fractional Brownian motion modeling of operation environment errors is realized; step 3, giving out discrete-state multi-UUV self-organizing coordination control based on an immune network, meeting the cooperative control of a multi-UUV system under a distributed structure, and realizing the enclosure operation of an enemy target; the method has the characteristics of strong self-organization, fault tolerance, instantaneity and the like, and is convenient for the engineering realization of the underwater unmanned system.)

一种基于行为的多UUV自组织协调控制方法

技术领域

本发明涉及水下无人系统建模与仿真领域，具体为一种基于行为的多UUV自组织协调控制方法。

背景技术

多UUV系统是由多种同构或异构UUV无人系统组成的空间、时间、事件和功能分布的水下网络，相比于单UUV其作业效率更高、应用领域更广，可在水下网络中扮演前置探测、通信节点、攻击武器、发射平台等多种角色，已成为我国深远海战略中民用和军用领域研究的热点。

在军事应用领域，多UUV系统作为一种武器系统、水下环境和作业使命相互耦合、相互影响的复杂水下无人作战系统，其任务分配、路径规划、规避障碍、协同搜索等所有群体决策的实现都要建立在高效率的协调控制基础之上。因此，如何设计高效率的协调控制模型直接影响多UUV系统水下作战使命完成的质量和效果，特别是在对敌方目标的围捕应用过程中。

目前，多UUV的协调控制模型根据系统结构可以分为两大类：集中式和分布式。集中式UUV协调控制模型必须通过协调控制中心对作业任务进行统一的规划和协调，如果感知信息完备和保证协调中心计算能力，则可以获得整个规划系统的全局最优解；该类模型虽然计算简单、便捷，但是应用场景往往受到限制，其动态性和鲁棒性较差。分布式协调控制模型由于采用自下而上的建模机制，既能满足多约束条件，又能保证协调过程代价最小，成为目前多UUV系统协调控制研究的重点；该类模型主要包括基于行为的方法、基于市场理论的方法和基于自组织理论的方法，其中基于自组织理论的方法由于受神经网络结构与原理的启发，将作业环境和信息感知映射到行为模型中，实现多UUV系统的路径规划，但是该模型是建立在UUV动态运动的理想条件之上，对实际的水下协同应用来说降低了模型的实用性和协同性。

免疫网络是一种结合免疫识别、免疫记忆、免疫耐受等进化过程的独特型网络理论，其认为免疫系统中免疫细胞彼此之间不是出于一种彼此独立的状态，而是通过抗体之间的相互激励和抑制，构成一个动态平衡的分布式网络结构。目前，免疫网络已成为自组织理论发展和创新的源泉。因此，希望借助免疫网络理论开发出协同性建模精度显著的一种基于行为的自组织协调控制模型，实现多UUV系统自组织完成对敌方目标的围捕。

发明内容

为了克服已有协调控制模型在多UUV系统围捕敌方目标应用中出现的问题；本发明提供一种基于行为的多UUV自组织协调控制方法。

本发明要解决的技术问题通过以下技术方案实现：

一种基于行为的多UUV自组织协调控制方法，包括以下步骤：

步骤1：构建免疫网络与多UUV系统之间的映射关系，并定义：多UUV系统包括N个UUV x_k∈[x₁，x₂，…，x_N]，UUV基本行为动作为A_i∈[A₁，A₂，A₃]，敌方目标包括M个敌方入侵移动目标y_h∈[y₁，y₂，…，y_M]；

步骤2：根据Farmer独特型网络的动力学微分数学模型，构建和定义交互强度水平C为：

式中，表示采取第i个基本行为动作A_i的第k个UUV x_k在t时刻的交互强度水平，C₁表示多UUV系统中UUV之间基本行为动作的激励与抑制水平；C₂表示敌方目标与UUV之间的刺激交互强度水平；C₃表示环环境误差模型引起的随机误差干扰水平C₃；C₄表示基本行为动作没有发生交互关系而引起的自然死亡率；

步骤3：通过计算C、C₁、C₂、C₃、C₄的离散状态方程，实现基于免疫网络的多UUV自组织协调控制，具体离散状态方程为：

式中，t表示时间，k₂为常数用于控制自然死亡概率的大小。

进一步的，所述步骤1中构建免疫网络与多UUV系统之间的映射关系的具体对应方式为：

免疫网络与多UUV系统对应，将多UUV系统类比成免疫网络，其由多个UUV智能体模型构成，实现围捕敌方目标；

B淋巴细胞与UUV对应，将UUV类比成B淋巴细胞，其是一个具有免疫计算功能的智能体模型；

抗原与敌方目标对应，将敌方目标类比抗原，其是相对于多UUV系统以外的敌方目标；

抗体与UUV基本行为动作对应，将UUV针对敌方目标采取的基本行为动作类比抗体，通过UUV基本行为动作实现对敌方目标的围捕；

抗原刺激与敌方目标入侵刺激对应，将敌方目标入侵刺激类比抗原刺激，作为引起多UUV系统协调控制的外在诱因；

抗体浓度与基本行为动作交互强度对应，刻画行为动作需求量大小；

抗体激励与基本行为动作交互强度增强对应，表示需要更多的UUV进行协调合作，才能完成围捕任务；

抗体抑制与基本行为动作交互强度减弱对应，表示由于UUV有足够的能力完成围捕任务，抑制其他UUV前来协助，否则会造成资源冗余；

消除抗原与围捕敌方目标对应。

进一步的，步骤1中所述UUV基本行为动作A_i包括：航行巡逻A₁、感知探测A₂和趋向目标A₃，其中，所述航行巡逻A₁的具体行为动作是：UUV以分布式结构采取航行巡逻行为动作进行水下敌方目标的巡逻；

所述感知探测A₂的具体行为动作是：在探测范围内，UUV执行感知探测行为动作发现敌方目标，并通过广播形式将探测结果发送相邻节点UUV；

所述趋向目标A₃的具体行为动作是：在通信范围内，相邻UUV接受信息后，执行趋向敌方目标的动作，形成围捕态势，其余UUV继续执行航行巡逻行为动作。

进一步的，通过下述公式(4)计算所述步骤2中多UUV系统中UUV之间基本行为动作的激励与抑制水平C₁：

式中，c_i(t)和c_j(t)分别表示t时刻第k个UUV采取第i个基本行为动作A_i的浓度和其他UUV采取第j个基本行为动作A_j的交互强度，i，j＝1，2，3，C_d表示UUV通信范围R_c内的UUV数量集合cr∈C_d，U_ij表示第k个UUV的基本行为动作与其通信范围内其他UUV基本行为动作之间的交互系数。

进一步的，通过下述公式(5)计算所述步骤2中的敌方目标与UUV之间的刺激交互强度水平C₂：

式中：c_i(t)和y_h(t)分别表示t时刻第k个UUV采取第i个基本行为动作的浓度和第h个敌方移动入侵目标的浓度，i＝1，2，3，h＝1，2，…，D_h，D_d表示UUV探测范围R_d内的抗原数量集合，V_ik表示第k个UUV的第i个基本行为动作与第h个敌方目标之间的交互系数。

进一步的，通过建立分数布朗运动模型，计算所述步骤2中环境误差模型引起的随机误差干扰水平C₃，具体为：

上式中，t＞0，p＞1，c_i服从均值为0方差为1的正态分布d_i在区间0≤d_i≤2π并服从均匀分布H∈(0，1)为粗糙度指数。

进一步的，对于第k个UUV的基本行为动作A_i由于没有与其他UUV的基本行为动作发生激励与抑制，则会产生自然死亡率C₄：

上式中，λ表示自然死亡率，τ表示压缩常数。

与现有技术相比，本发明的有益效果：

本发明受免疫网络启发，构建了免疫网络和多UUV系统之间的映射关系，设计了基于基本行为动作的协调控制动力学模型，能够满足分布式结构下多UUV系统的协同控制，实现对敌方目标的围捕作业，表现出强大的自组织性、容错性、实时性，而且便于水下无人系统的工程实现。

附图说明

图1是本发明提出的基于自组织理论的多UUV协调控制方法原理示意图；

图2是实施例中时间t＝50时多UUV系统航行巡逻的示意图；

图3是实施例中时间t＝100时多UUV系统探测感知到入侵目标的示意图；

图4是实施例中时间t＝150时多UUV系统围捕敌方入侵目标的示意图；

具体实施方式

下面结合具体实施例对本发明做进一步详细的描述，但本发明的实施方式不限于此。

如图1所示，为了克服已有协调控制模型在多UUV系统围捕敌方目标应用中出现的问题，受免疫网络启发，本实施例提出一种基于行为的多UUV自组织协调控制方法，实现分布式结构下多UUV系统基本行为动作对敌方目标的围捕。首先，构建免疫系统与多UUV系统之间的对应关系，并且设计航行巡逻、感知探测和趋向目标等基本行为动作(抗体)；其次，提出基于基本行为动作的协调控制动力学模型，并且实现作业环境误差的分数布朗运动建模；最后，给出了离散状态的基于免疫网络的多UUV自组织协调控制，满足分布式结构下多UUV系统的协同控制，实现对敌方目标的围捕作业，表现出强大的自组织性、容错性、实时性，而且便于水下无人系统的工程实现。

在详细叙述本实施例的方法之前，先对本方法的设计构思做以下说明：

在Farmer独特型免疫网络的动力学微分数学模型中，假设免疫系统有N个抗体[x₁，x₂，…，x_N]，M个抗原[y₁，y₂，…，y_M]，则抗体x_i的激励水平S_i和浓度变化s(x_i)分别表示为：

式(1)中，方括号第一项表示抗体x_i和x_j之间的抗体激励，对应于x_i部件idiotope与x_j部件paratope之间的连接，简称Stimulus1，其中，M_ij表示抗体之间的激励系数；第二项表示抗体x_i和x_j之间的抗体抑制，对应于x_i部件paratope与x_j部件idiotope之间的连接，简称为suppression，其中，M_ji表示抗体之间的抑制系数；第三项表示抗体x_j与抗原y_k之间的抗原激励，对应于x_i部件paratope与y_k部件epitope之间的连接，简称Stimulus2，其中，W_ik抗体与抗原之间的激励系数；第四项中λ_i表示抗体x_i由于没有发生激励与抑制而产生的自然死亡率；其中，k₁和k₂为常数，主要用来平衡抗体之间的激励与抑制。式(2)利用S型压缩函数对抗体浓度进行归一化处理。

基于上述设计构思，提出一种基于自组织理论的多UUV协调控制方法，本方法包括以下步骤：

步骤1：构建免疫网络与多UUV系统之间的映射关系，并定义多UUV系统包括N个UUVx_k∈[x₁，x₂，…，x_N]，UUV基本行为动作为A_i∈[A₁，A₂，A₃]，目标包括M个敌方入侵移动目标y_h∈[y₁，y₂，…，y_M]；

构建免疫网络与多UUV系统之间的对应关系，如表1所示。

表1 免疫网络和多UUV系统之间的映射关系

表1中具体对应关系：免疫网络与多UUV系统对应，将多UUV系统类比成免疫网络，其由多个UUV智能体模型构成，实现围捕敌方目标；B淋巴细胞与UUV对应，将UUV类比成B淋巴细胞，其是一个具有免疫计算功能的智能体模型；抗原与敌方目标对应，将敌方目标类比抗原，其是相对于多UUV系统以外的敌方目标；抗体与UUV基本行为动作对应，将UUV针对敌方目标采取的基本行为动作类比抗体，通过UUV基本行为动作实现对敌方目标的围捕；抗原刺激与敌方目标入侵刺激对应，将敌方目标入侵刺激类比抗原刺激，作为引起多UUV系统协调控制的外在诱因；抗体浓度与基本行为动作交互强度对应，刻画行为动作需求量大小；抗体刺激与基本行为动作交互强度增强对应，表示需要更多的UUV进行协调合作，才能完成围捕任务；抗体抑制与基本行为动作交互强度减弱对应，表示由于UUV有足够的能力完成围捕任务，抑制其他UUV前来协助，否则会造成资源冗余；消除抗原与围捕敌方目标对应。

基本行为动作A_i(抗体)定义及其描述如表2所示，主要包括：航行巡逻A₁、感知探测A₂和趋向目标A₃。

表2 协调控制的基本行为动作

步骤2：根据Farmer独特型网络的动力学微分数学模型，构建和定义的交互强度水平C为：

式中，表示采取第i个基本行为动作A_i的第k个在t时刻的交互强度水平，C₁表示多UUV系统中UUV之间基本行为动作的激励与抑制水平，相对于公式(1)将Stimulus1和suppression合为一个综合项；C₂表示敌方入侵目标与UUV之间的刺激交互强度水平，相当于公式(1)的Stimulus2；C₃表示环境误差模型；C₄与公式(2)相同，表示基本行为动作没有发生交互关系而引起的自然死亡率；

通过下述公式(4)计算所述步骤2中多UUV系统中UUV之间基本行为动作的激励与抑制水平C₁：

通过下述公式(5)计算所述步骤2中的敌方目标与UUV之间的刺激交互强度水平C₂：

式中：c_i(t)和y_h(t)分别表示t时刻第k个UUV采取第i个基本行为动作的浓度和第h个敌方移动入侵目标的浓度，i＝1，2，3，h＝1，2，…，D_h，D_d表示UUV探测范围R_d内的抗原数量集合，V_ik表示第k个UUV的第i个基本行为动作A_i与第h个敌方目标之间的交互系数。

本实施例的环境误差模型采用分数布朗运动FBM(Fractional Brownian Motion)来描述误差的随机性。FBM由Mandelbrot和Wallis在60年代建立降雨量模型时提出的布朗运动误差模型，对于随机化函数Y(t)的分数布朗运动其具有以下数学性质：(1)法正生长性：增量Y(t+σ)-Y(t)服从正态分布，均值为0，标准偏差或者方差为σ^1/2；(2)独立增量：如果t₁＜t₂＜t₃＜t₄，那么增量Y(t₂-t₁)与增量Y(t₄-t₃)相互独立；(3)时间无关性：对于所有的σ＞0，增量Y(t+σ)-Y(t)与t无关；(4)自放射性：对任意u和s，存在P(Y(t+σ)-Y(t)＜u)＝P(Y(s×(t+σ))-Y(s×t)＜s^σu)，其中，t＞0。正是由于FBM模型具有以上四个特性，FBM随机化Weierstrass函数被用来描述环境误差模型引起的随机误差干扰水平C₃，即通过建立分数布朗运动模型，计算所述步骤2中环境误差模型引起的随机误差干扰水平C₃，具体定义为：

上式中，t＞0，p＞1，c_i服从均值为0方差为1的正态分布d_i在区间0≤d_i≤2π并服从均匀分布H∈(0，1)为粗糙度指数，H∈(0，1)用于保证随机误差的合理性，消除变量的大幅度波动。

对于第k个UUV的基本行为动作A_i由于没有与其他UUV的基本行为动作发生激励与抑制，则会产生自然死亡率C₄：

上式中，λ表示自然死亡率，τ表示压缩常数。

步骤3：通过计算C、C₁、C₂、C₃、C₄的离散状态方程，实现基于免疫网络的多UUV自组织协调控制，具体离散状态方程为：

式中，t表示时间，k₂为常数用于控制自然死亡概率的大小。

具体描述本方法的一种具体实施实例如下：

假设仿真想定：在10000×10000单位范围的海域，N＝20个UUV采取基本行为动作A_i＝[A₁，A₂，A₃]实现对M＝1个敌方目标进行围捕作业，仿真结果如图2、图3和图4所示，其中小圆圈Agent标志UUV节点，大圆圈标志敌方入侵目标(Enemy Target)。

在图2中，时间t＝50时多UUV系统航行巡逻入侵目标，各个UUV继续执行基本行为A₁；在图2中，时间t＝100时多UUV系统中的Agent8在位置(2000，5000)探测感知到入侵目标，其基本行为立刻变为A₂；在图2中，时间t＝150时多UUV系统协同围捕敌方目标的态势已经形成，所有通信范围内UUV执行基本行为立刻变为A₃实现对目标的围捕。总的来说，本发明提出的一种基于行为的多UUV自组织协调控制方法能够通过行为的自组织网络完成对敌方目标围捕的协调控制，表现出强大的自组织性、容错性、实时性。

以上内容是结合具体的优选实施方式对本发明所作的进一步详细说明，不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说，在不脱离本发明构思的前提下，还可以做出若干简单推演或替换，都应当视为属于本发明的保护范围。

12页详细技术资料下载

上一篇：一种医用注射器针头装配设备

下一篇：一种复合制导跟踪控制方法与装置

一种基于行为的多uuv自组织协调控制方法

相关技术

网友询问留言