共享可迁移多场景特征的雷达抗干扰快速决策系统和方法

文档序号:1097771 发布日期:2020-09-25 浏览:15次 >En<

阅读说明:本技术 共享可迁移多场景特征的雷达抗干扰快速决策系统和方法 (Radar anti-interference quick decision-making system and method sharing migratable multi-scene characteristics ) 是由 李爽 刘驰 王占健 于 2020-06-11 设计创作,主要内容包括:本发明公开一种共享可迁移多场景特征的雷达抗干扰快速决策系统和方法,所述系统包括包括:策略自主学习子系统和策略快速适配子系统;所述方法包括:步骤1,选定第一干扰场景;步骤2,初始化第一特征提取模块和第一决策模块;步骤3,收集第一对抗数据并存储;步骤4,第一特征提取模块和第一决策模块的参数进行保存;步骤5,选定第二干扰场景;步骤6,初始化第二特征提取模块、适配模块、场景识别模块和第二决策模块;步骤7,收集第二对抗数据并存储;步骤8,对第二干扰场景中的适配模块、第二决策模块和场景识别模块进行自主学习。本发明所述系统和方法能够节约了人力和时间成本;抗干扰成功率高并提高了学习的速度。(The invention discloses a radar anti-interference quick decision-making system and method sharing migratable multi-scene characteristics, wherein the system comprises: a strategy self-learning subsystem and a strategy rapid adaptation subsystem; the method comprises the following steps: step 1, selecting a first interference scene; step 2, initializing a first feature extraction module and a first decision module; step 3, collecting and storing first countermeasure data; step 4, storing parameters of the first feature extraction module and the first decision module; step 5, selecting a second interference scene; step 6, initializing a second feature extraction module, an adaptation module, a scene recognition module and a second decision module; step 7, collecting and storing second antagonizing data; and 8, performing autonomous learning on the adaptation module, the second decision module and the scene recognition module in the second interference scene. The system and the method can save labor and time cost; the success rate of anti-interference is high and the learning speed is improved.)

共享可迁移多场景特征的雷达抗干扰快速决策系统和方法

技术领域

本发明涉及雷达抗干扰技术领域,具体涉及一种共享可迁移多场景特征的雷达抗干扰快速决策系统和方法。

背景技术

现代干扰环境下,雷达面临的一项主要威胁是干扰机等电磁干扰设备产生的有源干扰,即干扰设备通过侦察环境中的雷达信号并进行截获,针对性地产生干扰信号以扰乱、降低雷达的探测能力。当前有源干扰手段主要有三种:1)噪声压制干扰;2)欺骗(假目标)干扰;3)压制欺骗组合干扰。有源干扰大多来源于精心设计的干扰设备,具有干扰性强,雷达信号截获率高,干扰模式多变不易识别等特点,极易造成巨大的军事、人员损失,目前雷达抗干扰的基本思路是由人工分析、破解相应干扰设备的干扰模式和设计针对性的抗干扰措施,这一思路对已知的干扰模式是有效的,但在实际对抗中有源干扰方式复杂多变,其干扰手段也极可能是未知和难以掌控的,另外,雷达抗干扰机制设计、维护难度大,所需人工成本高,且大多只对单一干扰模式有效,面对复杂的组合干扰模式时并不能很好的识别出真实目标。

由于电磁干扰环境的日益复杂性,以及中国普遍缺乏自主化的雷达抗干扰决策系统和方法,在现代干扰环境下很容易导致雷达处于被动局面,引发严重的军事、经济损失。

有的研究机构提出了一种基于Q-学习的智能雷达对抗方法,主要针对多功能雷达,尤其是工作模式未知的雷达,利用强化学习(Reinforcement Learning,RL)基本原理提出了基于Q-学习的智能雷达对抗方法,给出了算法步骤,分析了Q矩阵收敛时间、收敛值与循环次数的关系。在给定仿真实验条件下,智能化雷达对抗Q矩阵收敛时间仅为秒量级,能根据干扰效果自主学习并智能决策,提高了雷达对抗系统的实时性与自适应性,且能同时对抗多工作模式的雷达,所述对抗方法的工作流程如下:

雷达与环境(由干扰设备产生的干扰环境)的交互过程为:①RL智能体(agent)对周围环境信息进行感知;②智能体依据当前的环境的状态st及反馈奖励rt,选择执行动作at;③at作用于环境,环境转换为st+1,并给出新的反馈奖励rt+1;④智能体根据反馈奖励值,计算回报值,并将回报值作为内部策略更新的依据。st∈S代表智能体在t时刻的状态,S为所有状态的集合;at∈A(st)表示智能体在t时选择的动作,A(st)表示在st下可选择动作的集合。当环境为st时,智能体选择并执行动作at,接收到反馈奖励rt+1∈R,同时转移到新的状态st+1。RL智能体与环境交互过程中,并没有收到指令选择何种策略,而是依据周围环境的反馈来决定的,基本原则是最大化智能体在学习中从周围环境获取正向信息的概率。上述为RL环境的基本交互过程,这里使用了Q-学习方法,将环境状态st与动作at的映射关系维系在一张表中,表中记录了st下每一个动作a所能获得的最大预期奖励,并选取奖励值最大的动作作为at。Q-学习中利用RL的奖励反馈机制达到对状态-动作表的单元数值更新(优化),从而求得最优的动作策略。

如上现有技术提出的方案都能够进行自主决策,不过上述现有技术使用的是传统的RL方法,这就使得其在诸多复杂的场景下无法学到有效的对抗策略,并且Q-学习算法自身也有许多限制,如面对连续型动作空间下的决策和环境状态集合容量特别大,基于表格的状态-动作关系维护就无法实现。另外,如上现有技术主要针对于提升干扰设备的干扰效果,与实现雷达的抗干扰决策相反,它解决的是如何对多功能雷达实施智能化的干扰,而不是如何帮助雷达完成抗干扰决策。

有的研究机构提出了一种基于干扰认知的智能化雷达干扰对抗系统(Intelligent Anti-Jamming System of Rader Based on Jamming Recognition),主要针对复杂电磁环境中目标稳定探测和跟踪问题。它通过对干扰进行侦查、识别、分类,在基于干扰分类的反干扰调度策略下自适应选择干扰对抗措施,并对干扰对抗效果进行定量评估,从而大幅度提高复杂电磁环境下探测效能和隐蔽生存能力。在前人对雷达智能抗干扰体系系统研究的基础上对基于博弈论的反干扰策略调度技术进行了研究,提出了一种干扰对抗效能的评估方法,以及一种智能化雷达干扰对抗系统。

所述对抗系统主要由自适应收发模块、环境感知模块、干扰动态知识库、自适应干扰处理模块、专家判决与人机交互模块等五个主要模块组成,自适应收发模块在自适应收发策略的控制下完成雷达信号的发射和接收,具备更强的自适应能力,环境感知模块是系统的核心,通过对干扰的频域、时域等多种特征的提取来实现,干扰动态知识库包含干扰特征库、抗干扰策略库以及抗干扰算法库,主要用于存储、调度和更新各种针对干扰的先验知识。自适应干扰处理模块包含抗干扰决策和自适应干扰抑制两个子系统,其中雷达的抗干扰决策采用了基于干扰认知的反干扰调度策略,对抗干扰措施实行最优化选择,专家判决与人机交互模块主要完成雷达抗干扰性能的评估和反馈,为反干扰决策提供依据,相比传统雷达抗干扰系统,基于干扰认知的智能化干扰对抗系统是一个全自适应的、依靠对干扰分类建库的闭合专家系统。

如上现有技术采用的是自适应的方法,在具体抗干扰策略的制定方面依然需要人工的精心设计和参与。另外,上述现有技术显然采用的是一种较为普适的抗干扰系统和手段,当面对不同的干扰场景时具有相同的分析和处理过程,并不能对不同的干扰场景进行针对性的抗干扰策略决策。因此,在面对不同干扰场景时,上述现有技术并不能够做到对多个不同的干扰场景都给出较好的抗干扰策略。

有的研究机构提出一种低空雷达的智能抗干扰技术研究(Intelligent Anti-jamming Technology of Low-altitude Radar),主要针对目前低空雷达抗干扰技术存在的问题,提出了低空雷达的智能抗干扰技术,并对环境感知、抗干扰措施的智能决策、抗干扰性能评估和系统的反干扰设计等关键技术进行了研究,结合电子干扰的多样化和智能化特点,通过让雷达根据外界的电子干扰变化以采取自适应选取抗干扰措施和综合运用多种抗干扰措施的方法,实现雷达抗干扰决策,另外,其有效地借鉴了认知雷达技术,使雷达能够与外界环境进行不断的交互和学习,通过对外界环境的感知,识别雷达干扰类型,采取反干扰措施,并对雷达抗干扰性能进行评估,然后,将评估结果为抗干扰措施的再优化提供支撑,根据雷达目前的主要任务,统筹雷达系统资源,实时调整雷达参数和控制,完成雷达的抗干扰,使雷达的抗干扰性能和工作性能处于最佳状态。上述现有技术的干扰感知是雷达对外界干扰环境的感知,从而形成实时干扰态势图,主要包括干扰有无感知、方向感知和干扰类型判别,为针对性选取抗干扰措施提供支持。抗干扰措施的决策是针对不同类型的干扰,选取合适的反干扰措施进行反干扰,使得雷达的反干扰性能达到最优。

如上现有技术包括环境感知和自适应策略调度两个过程,主要通过对环境感知结果的分析进行抗干扰策略的自适应调度,然后根据新的感知反馈重新调整下一次的策略调度,上述现有技术中的整个抗干扰过程加入了与环境的交互,将环境的实施反馈作为了下一步策略的调度决策因素,在一定程度上提升了雷达的决策能力。

如上现有技术属于自适应抗干扰手段,其利用与环境的交互信息引导抗干扰策略的调度,其也是一套固定不变的抗干扰系统和方法,在面对不同的干扰场景时并不能做出针对性的策略调整去更好的适配新干扰环境,上述现有技术3的具体抗干扰策略依然是人工制定好的,决策的目的是如何更精准的匹配已有策略,并没有帮助雷达做到抗干扰策略的自主学习。

综上所述,现有雷达抗干扰决策方法大多还处于自适应策略调度层面,即如何对已有抗干扰策略进行精准调用,并没有帮助雷达做到抗干扰策略的自主学习。因此,当面对新的干扰环境时,现有方法并不能保证其已有的抗干扰策略能够产生有效的抗干扰效果,另外,当面对不同的干扰场景时,现有的雷达抗干扰决策方法并不能自主学习和区分不同干扰场景之间的区别,也无法做到针对性的抗干扰策略决策,如何通过将一个干扰场景中的抗干扰策略快速迁移到另一个干扰场景中,从而避免重新学习抗干扰策略以减少有效抗干扰策略的搜索的时间,该问题在现有的雷达抗干扰决策领域还鲜有研究,但是其具有重要的现实意义和应用价值。

基于现有技术存在的上述技术问题,本发明提出一种共享可迁移多场景特征的雷达抗干扰快速决策系统和方法。

发明内容

本发明提供一种共享可迁移多场景特征的雷达抗干扰快速决策系统和方法。

为达到上述目的,本发明采用以下技术方案:

一种共享可迁移多场景特征的雷达抗干扰决策方法,包括:

步骤1,在多个干扰场景中选定一个干扰场景,记作第一干扰场景;

步骤2,在第一干扰场景中初始化第一特征提取模块和第一决策模块;

步骤3,在第一干扰场景中通过第一雷达与干扰环境的不断对抗交互来收集第一对抗数据并存储至第一共享数据存储模块;

步骤4,根据第一干扰场景中收集的对抗数据对第一特征提取模块和第一决策模块进行自主学习,并将学习完备的第一特征提取模块和第一决策模块的参数进行保存;

步骤5,在多个未被标记的干扰场景中选定优先级最大的另一个干扰场景,记作第二干扰场景;

步骤6,在第二干扰场景中初始化第二特征提取模块、适配模块、场景识别模块和第二决策模块;

步骤7,在第二干扰场景中通过第二雷达与干扰环境的不断对抗交互收集第二对抗数据并存储至第二共享数据存储模块,其中,第二对抗数据的数据量小于第一对抗数据的数据量;

步骤8,利用在第一干扰场景和第二干扰场景中收集的对抗数据,对第二干扰场景中的适配模块、第二决策模块和场景识别模块进行自主学习,第二特征提取模块从第一特征提取模块共享数据,并将学习完备的模块参数进行保存;

步骤9,第二干扰场景中的适配模块、第二决策模块和场景识别模块学习完备后,对场景识别模块进行删除处理;

步骤10,判断多个干扰场景中是否还有剩余未被标记过的干扰场景,是则重复步骤5-10,无剩余场景则结束。

进一步地,步骤3中,每次的对抗数据至少包括第一雷达在干扰环境中接收到的回波信息、采取的抗干扰策略、执行抗干扰策略后干扰环境给予的反馈和执行抗干扰策略后下一步接收到的回波信息。

进一步地,步骤4中,第一决策模块依据第一特征提取模块输出的特征进行策略决策,在对第一特征提取模块和第一决策模块进行学习时可以采用深度强化学习算法对模块进行学习。

进一步地,步骤7中,每次的对抗数据至少包括第二雷达在干扰环境中接收到的回波信息、采取的抗干扰策略、执行策略后干扰环境给予的反馈和执行策略后下一步接收到的回波信息。

进一步地,步骤8中,第二特征提取模块、适配模块和第二决策模块共同完成第二干扰场景下的抗干扰策略决策,其中,适配模块用于对第二特征提取模块输出的特征进行特征适配求得第一干扰场景和第二干扰场景的共有特征,第二决策模块使用适配模块的输出的共有特征生成抗干扰策略,场景识别模块为适配模块的辅助学习模块。

进一步地,步骤3中,收集第一对抗数据的目的是为了对第一干扰场景的第一对抗数据进行充分的挖掘和使用,以减少其他干扰场景中策略快速适配时的数据采集量。

进一步地,步骤8中,适配模块和场景识别模块使用梯度下降类算法进行学习以找出第一干扰场景和第二干扰场景的共有特征。

本发明另提供一种共享可迁移多场景特征的雷达抗干扰决策系统,包括:

第一雷达,用于对第一干扰场景进行探测;

第一环境感知模块,连接于第一雷达以接收环境信息,用于第一雷达在干扰环境中接收到的回波信息进行分析、处理;

第一信号处理模块,连接于第一雷达以接收雷达信号,连接于第一决策模块用于将第一决策模块生成的策略转换为对应的雷达信号;

第一共享数据存储模块,用于第一雷达与干扰环境不断交互对抗过程中产生的对抗数据的存储;

第一特征提取模块,连接于第一环境感知模块和第一决策模块,用于对雷达在干扰环境中接收的原始回波信息进行特征提取并将提取的特征发送至第一决策模块;

第一决策模块,连接于第一共享数据存储模块,用于第一雷达抗干扰策略的生成;

第二雷达,用于对第二干扰场景进行探测;

第二环境感知模块,连接于第二雷达以接收环境信息,用于第二雷达在干扰环境中接收到的回波信息进行分析、处理,连接于第二共享数据存储模块以发送环境信息;

第二信号处理模块,连接于第二雷达以接收雷达信号,连接于第二决策模块用于将第二决策模块生成的策略转换为对应的雷达信号;

第二共享数据存储模块,用于第二雷达与干扰环境不断交互对抗过程中产生的对抗数据的存储;

第二特征提取模块,连接于第二环境感知模块和适配模块,用于对第二雷达在干扰环境中接收的原始回波信息进行特征提取并将提取的特征发送至适配模块;

适配模块,连接于第二决策模块,用于提取多个干扰场景下雷达接收的回波信息的共有特征并将共有特征发送至第二决策模块;

第二决策模块,连接于第二共享数据存储模块,用于第二雷达抗干扰策略的生成。

进一步地,所述决策系统还包括场景识别模块,场景识别模块连接于适配模块以接收多个干扰场景下雷达接收的回波信息的共有特征。

与现有技术相比,本发明的优越效果在于:

本发明所述的共享可迁移多场景特征的雷达抗干扰快速决策系统和方法,免除了人工对雷达抗干扰策略的设计和制定,实现了雷达抗干扰策略的自主学习和决策,节约了人力和时间成本;针对多个不同的干扰场景,提出了针对性的抗干扰策略调整、适配方案,使得雷达在多个不同的干扰场景下均能提高的抗干扰成功率;与在每个干扰场景中都重新学习新的策略相比,在多个不同的干扰场景中实施抗干扰策略快速适配过程,学习到有效抗干扰策略的速度有效的提升。

附图说明

图1是本发明实施例中多场景雷达抗干扰快速决策系统架构图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述,需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

实施例

一种共享可迁移多场景特征的雷达抗干扰决策方法,包括:

步骤1,在多个干扰场景中选定一个干扰场景,记作第一干扰场景;

步骤2,在第一干扰场景中初始化第一特征提取模块和第一决策模块;

步骤3,在第一干扰场景中通过第一雷达与干扰环境的不断对抗交互来收集第一对抗数据并存储至第一共享数据存储模块;

步骤4,根据第一干扰场景中收集的对抗数据对第一特征提取模块和第一决策模块进行自主学习,并将学习完备的第一特征提取模块和第一决策模块的参数进行保存;

步骤5,在多个未被标记的干扰场景中选定优先级最大的另一个干扰场景,记作第二干扰场景;

步骤6,在第二干扰场景中初始化第二特征提取模块、适配模块、场景识别模块和第二决策模块;

步骤7,在第二干扰场景中通过第二雷达与干扰环境的不断对抗交互收集第二对抗数据并存储至第二共享数据存储模块,其中,第二对抗数据的数据量小于第一对抗数据的数据量;

步骤8,利用在第一干扰场景和第二干扰场景中收集的对抗数据,对第二干扰场景中的适配模块、第二决策模块和场景识别模块进行自主学习,第二特征提取模块从第一特征提取模块共享数据,并将学习完备的模块参数进行保存;

步骤9,第二干扰场景中的适配模块、第二决策模块和场景识别模块学习完备后,对场景识别模块进行删除处理;

步骤10,判断多个干扰场景中是否还有剩余未被标记过的干扰场景,是则重复步骤5-10,无剩余场景则结束。

在本实施例的步骤1中,干扰场景为人工设定的雷达与不同数量干扰机制的干扰设备共同组成的环境,每个干扰场景都有其初始优先级,初始优先级在人工设计场景时进行人为设定,在本实施例中,选定的干扰场景为初始优先级最大的。

在本实施例的步骤3中,每次的对抗数据至少包括第一雷达在干扰环境中接收到的回波信息或波形信息、采取的抗干扰策略、执行抗干扰策略后干扰环境给予的反馈和执行抗干扰策略后下一步接收到的回波信息;

收集大量对抗数据的目的是为了对第一干扰场景的第一对抗数据进行充分的挖掘和使用,以减少其他干扰场景中策略快速适配时的数据采集量;

回波信息或波形信息可用数值矩阵进行表示,干扰环境给予的反馈能够通过正向或负向表征,用以表示当下第一雷达受干扰的程度;

第一雷达能采用军用、民用或毫米波雷达的一种。

在本实施例的步骤4中,第一干扰场景中的第一特征提取模块和第一决策模块共同决定着最终的抗干扰策略生成,其中,第一决策模块依据第一特征提取模块输出的特征进行策略决策,在对第一特征提取模块和第一决策模块进行学习时可以采用深度强化学习等自主决策类算法对模块进行学习。

在本实施例的步骤5中,对于第二干扰场景的选择无特殊要求或规则,可以任意在剩余的场景中选择,与第一干扰场景作为基础干扰场景相对,第一干扰场景在此作为待适配的干扰场景,也可以根据初始优先级的排序,选择初始优先级最高的干扰场景。

在本实施例的步骤7中,每次的对抗数据至少包括第二雷达在干扰环境中接收到的回波信息或波形信息、采取的抗干扰策略、执行策略后干扰环境给予的反馈和执行策略后下一步接收到的回波信息;

回波信息或波形信息可用数值矩阵进行表示,干扰环境给予的反馈能够用正向或负向表征,用以表示当下第二雷达受干扰的程度。

在本实施例的步骤8中,第二特征提取模块、适配模块和第二决策模块共同完成第二干扰场景下的抗干扰策略决策,其中,适配模块用于对第二特征提取模块输出的特征进行特征适配求得第一干扰场景和第二干扰场景的共有特征,第二决策模块使用适配模块的输出的共有特征生成抗干扰策略,场景识别模块为适配模块的辅助学习模块,用于帮助适配模块完成学习任务,其中,需要利用第一干扰场景中收集的大量对抗数据和第二干扰场景中收集的少量对抗数据对适配模块、场景识别模块和第二决策模块进行自主学习,每个模块有着不同的学习任务,适配模块和场景识别模块能够使用梯度下降类算法进行学习,适配模块的学习任务是找出第一干扰场景和第二干扰场景的共有特征,使得场景识别模块无法通过共有特征辨别出当前的共有特征是来源于第一干扰场景还是第二干扰场景,而场景识别模块的任务则是尽最大可能的通过适配模块输出的共有特征来对其来源进行精确识别,第二决策模块的任务是通过适配模块输出的共有特征完成第一干扰场景和第二干扰场景下的抗干扰策略生成,可以通过DRL等自主学习类算法来完成该模块的学习。

如图1所示,共享可迁移多场景特征的雷达抗干扰决策系统,包括策略自主学习子系统和策略快速适配子系统,其中,策略自主学习子系统用于第一特征提取模块和第一决策模块的学习,策略快速适配子系统用于第二干扰场景的策略快速适配,策略自主学习子系统包括第一雷达、第一环境感知模块、第一信号处理模块、第一特征提取模块、第一决策模块和第一共享数据存储模块;策略快速适配子系统包括第二雷达、第二环境感知模块、第二信号处理模块、第二共享数据存储模块、第二特征提取模块、适配模块和第二决策模块;

第一雷达,用于对第一干扰场景进行探测;

第一环境感知模块,连接于第一雷达以接收环境信息,用于第一雷达在干扰环境中接收到的回波信息进行分析、处理;

第一信号处理模块,连接于第一雷达以接收雷达信号,连接于第一决策模块用于将第一决策模块生成的策略转换为对应的雷达信号;

第一共享数据存储模块,用于第一雷达与干扰环境不断交互对抗过程中产生的对抗数据的存储;

第一特征提取模块,连接于第一环境感知模块和第一决策模块,用于对雷达在干扰环境中接收的原始回波信息进行特征提取并将提取的特征发送至第一决策模块,其中,原始回波信息有两个来源,其一是第一环境感知模块的输出,其二是第一共享数据存储模块的储存;

第一决策模块,连接于第一共享数据存储模块,用于第一雷达抗干扰策略的生成;

第二雷达,用于对第二干扰场景进行探测;

第二环境感知模块,连接于第二雷达以接收环境信息,用于第二雷达在干扰环境中接收到的回波信息进行分析、处理,连接于第二共享数据存储模块以发送环境信息;

第二信号处理模块,连接于第二雷达以接收雷达信号,连接于第二决策模块用于将第二决策模块生成的策略转换为对应的雷达信号;

第二共享数据存储模块,用于第二雷达与干扰环境不断交互对抗过程中产生的对抗数据的存储;

第二特征提取模块,连接于第二环境感知模块和适配模块,用于对第二雷达在干扰环境中接收的原始回波信息进行特征提取并将提取的特征发送至适配模块,其中,原始回波信息有两个来源,其一是第二环境感知模块的输出,其二是第二共享数据存储模块的储存,第二特征提取模块提取干扰环境信息(回波信息)的有效特征并输出至适配模块,供适配模块进行下一步提取多个干扰场景下第二雷达接收的回波信息的共有特征使用,通过与第一特征提取模块的数据共享减少了需要学习的总参数量,从而节省了策略适配的时间成本;

适配模块,连接于第二决策模块,用于提取多个干扰场景下雷达接收的回波信息的共有特征并将共有特征发送至第二决策模块,适配模块的目的是在第二特征提取模块提取出的有效特征基础上,再进一步对多个干扰环境的特征进行共有特征提取,共有特征的提取使得在收集少量对抗数据的情况下进行抗干扰策略的适配;

第二决策模块,连接于第二共享数据存储模块,用于第二雷达抗干扰策略的生成。

其中,第一环境感知模块连接于第一共享数据存储模块以发送环境信息。

其中,第二环境感知模块连接于第二共享数据存储模块以发送环境信息。

第一环境感知模块和第二环境感知模块均以雷达在干扰环境中接收到的原始回波信息为输入,然后将回波信息表示为数值矩阵并分析,分析过程主要为计算回波信息中雷达所发射探测信号所占信噪比和本次抗干扰结果,信噪比与抗干扰结果的关系如下所示:

Figure BDA0002535574490000101

其中,1表示抗干扰成功,0表示抗干扰失败,为了能够更好的生成抗干扰策略,第一环境感知模块和第二环境感知模块的输出为雷达接收到的原始回波信息及本次的抗干扰结果。

决策模块(第一决策模块和/或第二决策模块)输出的策略均为雷达(第一雷达和/或第二雷达)信号的参数集合,其中每个参数表示为0-1之间的连续数值,而信号处理模块(第一信号处理模块和/或第二信号处理模块)的功能就是将决策模块输出的这组0-1的数值集合分别转换到雷达对应的实际信号参数中去,将雷达信号的各个参数在各自取值区间内进行归一化处理,得到0-1之间的参数取值,归一化过程为:

所以,信号处理模块的转换过程即为反归一化过程,从而将0-1之间的参数值转换为雷达信号的实际值,另外,对于实数性雷达信号参数,直接采用反归一化后的数值即可,对于整数型雷达信号参数,需要对反归一化后的值按实际情况进行向上或向下取整,该模块的输出将直接应用于雷达下一步要发射的信号参数设置。

所述决策系统还包括场景识别模块,场景识别模块连接于适配模块以接收多个干扰场景下雷达接收的回波信息的共有特征,用于适配模块的辅助学习,其中,场景识别模块以适配模块输出的共有特征为输入,对共有特征的提取来源进行判别,场景识别模块与适配模块的学习任务是相对的,适配模块的学习任务是使得场景识别模块无法通过共有特征对共有特征的来源进行判别,也由此,才能辅助适配模块学习到提取多个干扰场景中的共有特征。

本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书界定。

12页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:一种毫米波汽车防撞雷达二维干扰抑制方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!