无人机抗干扰通信系统及联合轨迹与波束成形优化方法

文档序号:1893060 发布日期:2021-11-26 浏览:21次 >En<

阅读说明:本技术 无人机抗干扰通信系统及联合轨迹与波束成形优化方法 (Unmanned aerial vehicle anti-interference communication system and joint track and beam forming optimization method ) 是由 陈瑾 侯志峰 罗屹洁 方贵 谷江春 徐逸凡 于 2021-08-25 设计创作,主要内容包括:无人机抗干扰通信系统及联合轨迹与波束成形优化方法,属于无线通信抗干扰技术领域,考虑一个抗全频段强功率干扰的通信网络,该网络内基站为移动用户提供通信服务,同时一个全频段的全向干扰机以功率压制的方式对于合法通信链路进行干扰。该干扰机具备一定的隐蔽性,其信息对于合法通信双方无法准确获取。利用无人机感知环境获取状态信息。通过ε-greedy探索利用策略,依概率选择由神经网络估计的最佳回报值动作。智能反射无人机通过执行方案得到该动作的真实回报值,并将经验信息存储于滑动存储窗中。在多步经验池中的经验信息达到一定数量之后,神经网络进行更新,通过神经网络拟合环境后进行最优决策。能够很好地应用于实时抗干扰通信场景。(An unmanned aerial vehicle anti-interference communication system and a joint track and beam forming optimization method belong to the technical field of wireless communication anti-interference, a communication network resisting full-band strong power interference is considered, a base station in the network provides communication service for mobile users, and meanwhile, a full-band omnidirectional jammer interferes a legal communication link in a power suppression mode. The jammer has certain concealment, and information of the jammer cannot be accurately acquired by both legal communication parties. And acquiring state information by using the unmanned aerial vehicle to sense the environment. And selecting the action of the optimal return value estimated by the neural network according to the probability by searching and utilizing the strategy through epsilon-greedy. The intelligent reflection unmanned aerial vehicle obtains a real return value of the action through an execution scheme, and stores experience information in a sliding storage window. And after the experience information in the multi-step experience pool reaches a certain amount, updating the neural network, and fitting the environment through the neural network to perform optimal decision. The method can be well applied to a real-time anti-interference communication scene.)

无人机抗干扰通信系统及联合轨迹与波束成形优化方法

技术领域

本发明涉及无线通信抗干扰技术领域,具体涉及一种无人机抗干扰通信系统及联合轨迹与波束成形优化方法。

背景技术

当场景中存在强功率的全频段干扰时,实现可靠、稳健的信息传输是一个重要研究方向。由于干扰在频域与功率域的双重压制,常用的抗干扰手段难以解决。智能反射表面作为新技术具有无源反射,相位灵活调整,部署方便等优点,在解决这一场景下的抗干扰通信具有广阔前景。通过结合无人机技术,将智能反射表面部署在无人机上,通过实时调整无人机位置,在动态环境中,系统的抗干扰性可以得到进一步提升。

发明内容

本发明提出一种无人机抗干扰通信系统及联合轨迹与波束成形优化方法,很好地应用于实时抗干扰通信网络场景,以实现全频段强功率干扰条件下的高效抗干扰通信。在深度强化学习算法的基础之上,通过利用智能反射表面相位变化与波束成形高度耦合对于被动波束成形动作决策空间进行了大幅度降低,同时在轨迹规划中引入了多步经验引用,通过多步路径的分析进一步提高路径决策的准确性。

实现本发明目的的技术解决方案为:一种动态未知环境下抗干扰通信模型,对该模型作如下刻画:考虑一个抗全频段强功率干扰的通信网络,该网络内存在一个基站对于移动用户进行通信覆盖服务,但一个全频段的全向干扰机以功率压制的方式对于合法通信进行干扰。该干扰机具备一定的隐蔽性,其信息对于合法通信双方无法准确获取。

在某一拓扑状态内,移动用户D接收到的信号定义为:

其中,PS为基站发射功率,PJ是干扰机干扰功率,HS、HJ、hSD和hJD是基站S与移动用户D直射链路信道增益、干扰机J与移动用户D直射链路信道增益、基站S信号经智能反射表面U反射后到达移动用户D的联合信道增益和干扰机J信号经智能反射表面U反射后到达移动用户D的联合信道增益。xS为基站发射信号,xJ为干扰机发射信号,z为移动用户D接收到的高斯白噪声,其服从均值为0,方差为δ2的高斯分布。因此,移动用户D在某一拓扑状态下的信干噪比具体表示为:

因此,移动用户D接收的可达通信速率表示为:

考虑通过联合优化无人机运动轨迹与智能反射表面被动波束成形,其中智能反射表面信道与波束成形方向存在强烈耦合关系,因此经智能反射表面反射后用户接受信道具体表示为:

其中,Gt,Gr和G是发射端,接收端和智能反射表面反射单元的天线增益,M和K是智能反射表面包含反射单元的行数和列数,dx和dy是反射单元的行宽和列宽,d1和d2是智能反射表面与发送端和接收端之间的距离,θt和θr是发射端信号和接收端信号与x轴的夹角,为发射端信号和接收端信号与z轴的夹角,A是智能反射表面对于信号幅度的调整值,λ是信号的波长,是反射单元的归一化功率辐射函数,是波束成形方向偏移函数,其反映了波束成形方向偏移造成的信号幅度衰减,具体表示为:

其中,φk,m是第行列反射单元所对应的相位变化值,当波束成形方向与接收端完全对齐,则反射单元的相位变化值可以表示为

根据智能反射表面相位与波束成形方向的耦合关系可以通过波束成形方向降低相位设计的算法复杂度。

发送方与智能反射表面在通信过程中,首先进行状态感知,然后执行基于深度强化学习的优化算法,依概率进行位置部署与波束成形的优化,通信后根据反馈值调整概率。其中,优化算法包括以下步骤:

步骤1,通过设计状态、动作、回报值以及转移概率函数将该抗干扰通信问题建模为马尔科夫决策过程

步骤2,初始化系统场景及神经网络,根据状态收集、动作决策及反馈对神经网络参数进行更新。

步骤3,将执行算法后的路径与波束成形方案进行记录。

本发明通过被动波束成形模型设计,大尺度智能反射表面的相位变化优化算法动作状态空间得到降低,利于路径规划过程中强化学习收敛速度的提升,进一步提高算法的反应速度与抗干扰场景下的适配性。

本发明的发送端通过信道感知以及无人机的状态信息通信链路获取移动用户的位置和信道状态信息,在既定波束成形方向的情况下,可以直接对于发送端到智能反射表面端的波束成形方向进行校正。另一方面,由于干扰机的信息未知,通过深度强化学习交互的方式对于干扰机的信息进行探索,利用波束成形方向的实时控制寻找最佳智能反射面被动波束成形方案与无人机飞行轨迹。

本发明的感知信道状态后智能反射表面可以执行的被动波束成形设计可以分两种情况:①增强有用信号②降低干扰信号。

增强有用信号,即发送端经智能反射表面反射后到达用户接收端的信号与发送端和接收端直达信号之间的相位相同,接收端将信号进行叠加后有用信号强度远大于干扰信号强度,从而达到抗干扰的目的。

降低干扰信号,不管干扰信号以多大的功率进行干扰,智能反射表面将干扰发出的信号进行反射后在接收端进行重新聚焦,但信号经过反相处理,因此在接收端直射的干扰信号与反射的干扰信号会进行抵消,相对于有用信号,干扰信号得到降低,抗干扰通信效果得到提升。

本发明提出的智能反射表面无人机抗干扰通信系统和基于深度强化学习的联合轨迹与波束成形优化方法,旨在提供方案以实现全频段强功率干扰条件下的高效抗干扰通信。本发明在深度强化学习算法的基础之上,通过利用智能反射表面相位变化与波束成形高度耦合对于被动波束成形动作决策空间进行了大幅度降低,同时在轨迹规划中引入了多步经验引用,通过多步路径的分析进一步提高路径决策的准确性。

附图说明

图1是无人机抗干扰通信系统的网络示意图。

图2是基于深度强化学习的轨迹与波束成形联合优化方法示意图。

图3是本发明实施例1中的拓扑示意图。

图4是本专利算法与其他算法性能对比图

图5是不同干扰机位置情况下本专利算法性能对比图。

具体实施方式

下面结合附图对本发明的技术方案进行详细描述:

如图1所示,一种无人机抗干扰通信系统,考虑一个抗全频段强功率干扰的通信网络,该网络内存在一个基站对于移动用户进行通信覆盖服务,但一个全频段的全向干扰机以功率压制的方式对于合法通信进行干扰。该干扰机具备一定的隐蔽性,其信息对于合法通信双方无法准确获取,为了达到最大吞吐量,通过联合调整智能反射表面无人机的位置与智能反射表面被动波束成形,充分探索该系统的抗干扰效能。

进一步地说,在某一拓扑状态内,移动用户D接收到的信号定义为:

其中,PS为基站发射功率,PJ是干扰机干扰功率,HS、HJ、hSD和hJD是基站S与移动用户D直射链路信道增益、干扰机J与移动用户D直射链路信道增益、基站S信号经智能反射表面U反射后到达移动用户D的联合信道增益和干扰机J信号经智能反射表面U反射后到达移动用户D的联合信道增益。xS为基站发射信号,xJ为干扰机发射信号,z为移动用户D接收到的高斯白噪声,其服从均值为0,方差为δ2的高斯分布。因此,移动用户D在某一拓扑状态下的信干噪比具体表示为:

因此,移动用户D接收的可达通信速率表示为:

考虑通过联合优化无人机运动轨迹与智能反射表面被动波束成形,其中智能反射表面信道与波束成形方向存在强烈耦合关系,因此经智能反射表面反射后用户接受信道具体表示为:

其中,Gt,Gr和G是发射端,接收端和智能反射表面反射单元的天线增益,M和K是智能反射表面包含反射单元的行数和列数,dx和dy是反射单元的行宽和列宽,d1和d2是智能反射表面与发送端和接收端之间的距离,θt和θr是发射端信号和接收端信号与x轴的夹角,为发射端信号和接收端信号与z轴的夹角,A是智能反射表面对于信号幅度的调整值,λ是信号的波长,是反射单元的归一化功率辐射函数,是波束成形方向偏移函数,其反映了波束成形方向偏移造成的信号幅度衰减,具体表示为:

其中,φk,m是第行列反射单元所对应的相位变化值,当波束成形方向与接收端完全对齐,则反射单元的相位变化值可以表示为

根据智能反射表面相位与波束成形方向的耦合关系可以通过波束成形方向降低相位设计的算法复杂度。

如图2所示,本发明的基于深度强化学习的联合轨迹与波束成形优化方法的具体过程为:发送方与智能反射表面在通信过程中,首先进行状态感知,然后执行基于深度强化学习的优化算法,依概率进行位置部署与波束成形的优化,通信后根据反馈值调整概率。其中,优化算法包括以下步骤:

步骤1,通过设计状态、动作、回报值以及转移概率函数将该抗干扰通信问题建模为马尔科夫决策过程

步骤2,初始化系统场景及神经网络,根据状态收集、动作决策及反馈对神经网络参数进行更新。

步骤3,将执行算法后的路径与波束成形方案进行记录。

其中,步骤1中,通过被动波束成形模型设计,大尺度智能反射表面的相位变化优化算法动作状态空间得到降低,利于路径规划过程中强化学习收敛速度的提升,进一步提高算法的反应速度与抗干扰场景下的适配性。步骤2中,发送端通过信道感知以及无人机的状态信息通信链路获取移动用户的位置和信道状态信息,在既定波束成形方向的情况下,可以直接对于发送端到智能反射表面端的波束成形方向进行校正。另一方面,由于干扰机的信息未知,通过深度强化学习交互的方式对于干扰机的信息进行探索,利用波束成形方向的实时控制寻找最佳智能反射面被动波束成形方案与无人机飞行轨迹。

在深度强化学习算法中,包括以下步骤:

初始化,迭代次数设为i=1,设置状态-动作-汇报存储空间,神经网络初始化参数,以及探索-利用概率ε。

步骤11,智能反射表面-无人机与环境进行交互,获取i时刻的状态si

步骤12,智能反射表面-无人机依概率进行运动轨迹和被动波束成形相位设计的动作选择。通过ε-greeedy探索-利用策略,具体表示为:

其中,ai为智能反射表面-无人机在i时刻的动作选择,si为智能反射表面-无人机在i时刻的状态,Q(si,ai)为智能反射表面-无人机在si的状态下做出ai动作后的回报值,根据公式(7),在si的状态下,智能反射表面有ε的概率选择使得其回报值最大的动作,有1-ε的概率随机选择动作。通过在迭代过程中逐渐增加ε的值智能反射表面-无人机可以在探索与利用之间寻求平衡,在尽可能的探索所有动作的情况下,较快地获得最优方案。

步骤13,执行动作ai后达到的下一时刻状态si+1,并获取回报值,将状态-动作-回报值-下一时刻状态[si,ai,ri,si+1]储存在滑动存储窗口中。

步骤14,令i=i+1以及si=si+1,重复步骤11-14,直至滑动存储窗被历史经验数据填满。

步骤15,当滑动存储窗被历史经验数据填满后,计算多步的经验数据,其中多步回报值的具体表示为:

其中,N是滑动储存窗的长度,γ是回报值的折扣率,反应了今后回报值对于现在动作的影响程度,当γ=1时,则充分考虑未来回报值的影响,但会造成回报值的过度震荡,影响收敛效果。当γ=0时,则仅仅考虑下一时刻回报值的影响,算法决策速度快,但会丢失对于未来趋势的把握。

在获得多步回报值后,将多步经验信息[si,ai:i+N,si+N,ri:i+N]存储在经验池中,用于神经网络的进一步更新。同时,不断获取的新的[si,ai,ri,si+1]在储存入滑动存储窗时,旧的信息会被抛弃,通过滑动存储窗不断得到新的多步经验信息[si,ai:i+N,si+N,ri:i+N]不断存入经验池中。

步骤16,当经验池中的多步经验信息达到一定数量时,开始对于神经网络进行更新,否则重复步骤11-15。

步骤17,更新神经网络参数。并在迭代过程中不断增加ε的值。使得智能反射表面-无人机有趋向性地做出使得回报值大的动作选择。

本发明利用感知信道状态后智能反射表面可以执行的被动波束成形设计可以分两种情况:①增强有用信号②降低干扰信号。

增强有用信号,即发送端经智能反射表面反射后到达用户接收端的信号与发送端和接收端直达信号之间的相位相同,接收端将信号进行叠加后有用信号强度远大于干扰信号强度,从而达到抗干扰的目的。

降低干扰信号,不管干扰信号以多大的功率进行干扰,智能反射表面将干扰发出的信号进行反射后在接收端进行重新聚焦,但信号经过反相处理,因此在接收端直射的干扰信号与反射的干扰信号会进行抵消,相对于有用信号,干扰信号得到降低,抗干扰通信效果得到提升。

实施例1

本发明的第一个实施例具体描述如下,系统仿真采用python语言,参数设定不影响一般性。假设各节点相对位置如图3所示。基站位置WS=[10,10],移动用户初始WD[0]=[1000,1000],仿真结果如图4所示。

图4给出了不同干扰功率下,各优化方案的抗干扰通信效能示意图,可以看出通过所提出的联合轨迹与波束成形优化,系统的抗干扰效能相对于单一优化方法在动态环境中可以得到显著提高。并且在干扰功率较高时也可以保持明显的抗干扰通信效果,实现了在强功率全频段干扰条件下的稳健抗干扰通信。

实施例2

本发明的第二个具体实施例如下描述,系统仿真采用python软件,参数设定不影响一般性。针对不同干扰位置,所提联合优化方法可以在未知干扰机位置的情况下保持较高的抗干扰通信速率,同样对比单一的优化方法抗干扰效能得到显著提高。证明了该算法在未知环境中的适配性。

此外,对算法的性能进行仿真分析,将本算法与不同算法进行比较,可达通信速率对比图如图5所示。对于不同干扰位置,本文提出的联合优化算法明显优于一般的随机算法。

综上所述,本专利给出了联合路径与波束成形优化方案,能使得在全频段高功率干扰机条件下的抗干扰通信性能达到最优。

13页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:极化码编码及译码方法和装置、信息传输系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!