一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法

文档序号:1908030 发布日期:2021-11-30 浏览:15次 >En<

阅读说明:本技术 一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法 (Simultaneous interference and eavesdropping method based on Bayesian Stackelberg game ) 是由 王伟 刘一甲 戚楠 黄叶婷 王可为 苏悦悦 黄赞奇 于 2021-09-09 设计创作,主要内容包括:本发明公开了一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法,包括:场景建模:建立基于我方智能干扰机与敌方通信用户对的对抗场景模型;博弈建模:利用全双工技术,将敌我双方用户在不完全信息条件下通信对抗建模为贝叶斯Stackelberg博弈模型,将同时实施干扰与窃听的问题转化为博弈优化问题;优化求解:采用连续凸近似SCA转化领导者与跟随者的非凸优化问题,并通过KKT条件求解贝叶斯Stackelberg博弈均衡解。与半双工,单独干扰以及单独窃听方案相比,本发明提出的同时干扰与窃听仿真说明本发明方法具有很好的准确性与收敛性,优于其他方案。(The invention discloses a simultaneous interference and eavesdropping method based on a Bayesian Stackelberg game, which comprises the following steps: scene modeling: establishing an confrontation scene model based on the intelligent jammer of the party and the communication user pair of the enemy; game modeling: by utilizing a full-duplex technology, the communication countermeasure of the users of the enemy and the my parties under the incomplete information condition is modeled into a Bayesian Stackelberg game model, and the problem of simultaneously implementing interference and eavesdropping is converted into a game optimization problem; and (3) optimizing and solving: and transforming a non-convex optimization problem of the leader and the follower by adopting a continuous convex approximation SCA, and solving a Bayesian Stackelberg game equilibrium solution by using a KKT condition. Compared with half-duplex, single interference and single interception schemes, the simultaneous interference and interception simulation provided by the invention shows that the method has good accuracy and convergence and is superior to other schemes.)

一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法

技术领域

本发明属于电子战场无线通信对抗技术领域,具体涉及一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法。

背景技术

近年来,在军事无线通信领域,迫切需要及时监控敌方发射机向目标接收机发送的战术信息,并在需要时立即中断传输。获得信息优势是决定战场优势的重要因素,面对具有智能抗干扰能力的对手,单纯的电磁干扰不足以发挥有效的杀伤力,同时,单纯的窃听也很难获得对方用户的有效信息。

全双工技术在满足上述需求方面具有巨大优势,因为它有助于同时进行干扰和窃听。因此,研究同时干扰与窃听的功率策略的制定也是目前的研究热点。基于全双工同时干扰与窃听技术,作为一个新兴的热点问题,目前仍是一个未充分探索的研究方向。现有的一些研究可以分为两个研究方向,即理论方面和实验方面。

在理论方面,T.Riihonen在2017年介绍了同时发送和接收能力的攻击性的应用,并且这种能力能够在敌对情况下进行联合干扰和感知。J.Mietzner在2012年研究了响应性攻击应用,以保护车辆免受无线电控制爆炸物的伤害。L.Kong在2016年研究了存在一个可窃听用户数据传输同时释放干扰信号的主动窃听者时的物理安全问题,并在其中推导出了受害节点的保密中断概率。

在实验上,在通用软件无线电设备定义的无线电上执行了几个室内实验室实验工作,这验证了全双工同时干扰与窃听技术的可行性。然而,目前已发表的作品关注的是窃听链路上的信干噪比,即监听效果,而忽略了干扰效果和对方用户可能是智能的这一事实。D.Yang在2013年中创新性地将功率控制问题建模为Stackelberg博弈。首先估计干扰机(作为跟随者)的最佳响应策略,在此基础上确定领导者的最优策略。X.Tang在2017年研究了具有安全性的节能传输在Stackelberg博弈框架下存在全双工主动窃听者的问题,这提高了对于同时窃听和干扰的防御,但是这些工作都没有站在攻击方的立场,研究同时干扰与窃听策略的制定。

在电子对抗中,单纯的电磁干扰不足以发挥有效的杀伤力。同时,单纯的窃听也很难获得对方用户的有效信息。传统的电磁对抗技术难以满足通信战场的需求。总的来说,现有的无线通信对抗模型与角度主要存在以下问题:1)未考虑对抗环境下,信道信息的不完全性。2)未考虑到用户的智能性,智能用户往往能够根据对方的策略动态改变己方策略。3)未站在攻击方的角度,考虑同时干扰与窃听策略如何高效的制定。

发明内容

本发明所要解决的技术问题是针对上述现有技术的不足,提供一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法,利用全双工技术,将敌我双方用户在不完全信息条件下通信对抗建模为贝叶斯Stackelberg博弈,实现同时干扰与窃听,并通过连续凸近似将领导者与跟随者的非凸优化问题转化,并通过KKT条件求解Stackelberg博弈均衡。

为实现上述技术目的,本发明采取的技术方案为:

一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法,包括:

步骤1:场景建模:建立基于我方智能干扰机与敌方通信用户对的对抗场景模型;

步骤2:博弈建模:基于步骤1的对抗场景模型,利用全双工技术,将敌我双方用户在不完全信息条件下通信对抗建模为贝叶斯Stackelberg博弈模型,确定领导者与跟随者,将同时实施干扰与窃听的问题转化为博弈优化问题,该博弈优化问题为领导者与跟随者的非凸优化问题;

步骤3:优化求解:采用连续凸近似SCA转化领导者与跟随者的非凸优化问题,并通过KKT条件求解贝叶斯Stackelberg博弈均衡解。

为优化上述技术方案,采取的具体措施还包括:

上述的步骤1所述的对抗场景模型中,博弈双方为我方智能干扰机与敌方通信用户对,其中我方智能干扰机的工作模式是全双工的,释放干扰的同时,对敌方通信用户实施窃听,敌方通信用户存在一对通信收发对,实时传输信息,具体的:

以R表示我方智能干扰机的编号,S-D表示敌方通信收发对的编号,在对抗场景中,任意两个节点间的信号传输同时存在路径损耗和小尺度衰落,双方用户很难知道对方确切的信道状态信息,双方用户对小信道衰落持有不完全的认知;

对于同一个信道,需要两个不同的概率来表示信道功率增益的不确定性,用b,e分别表示我方全双工干扰机R和敌方S-D通信对,令a∈(b,e);

a对节点x到节点y的小尺度衰落增益的认知集和为:

表示一定概率下第z个小尺度衰落增益取值,z∈{1,2,…,Z}表示集合索引号,节点s,d,r分别表示发射机S、接收机R、全双工节点R;“-”是一个排除运算符;

因此,基于a的认知,节点x到节点y信道增益为:

其中,为自由空间路径损耗,α为路径损耗系数,dx,y是节点x到节点y的距离;

由于智能干扰机R采用全双工通信方式,会存在一定的自干扰,假设a对于R的自干扰信道增益的认知集为:

其中n∈{1,2,...,N}表示集合索引号,为第n个自干扰衰落增益取值;

因此,基于a的认知,自干扰信道增益定义为:

其中k0为自干扰消除因子。

上述的步骤1所述的对抗场景模型中,还定义存在干扰与窃听的对抗场景下的基于认知的信干噪比,具体的:

在S-D战术通信过程中,会受到全双工干扰机R的干扰与窃听,基于a的认知,节点D收到的信号为:

其中为从S接收到的信号;是节点R的干扰信号;i∈{1,2,…,I},i是S与D之间小衰落增益一个离散采样,j∈{1,2,…,J},j为R与D之间的小衰落增益一个离散采样;ps和pr分别是节点S的发射功率和节点R的干扰功率;xs和xr分别为S和R的发射信号;n1为加性高斯白噪声;

因此,a对于节点D处接收信干噪比的认知是一个二维随机变量,取决于a对S-D和R-D信道增益的认知,分别表示为

因此,a认为节点D处接收信干噪比为:

其中,N1为节点D处高斯噪声的单侧功率谱密度;Bs是S-D信道带宽;

为了监视什么战术数据被S发送到它的目标接收者D,全双工节点R窃听S-D传输信号,因此,在R处接收的信号由窃听信号和自干扰信号组成,a对于R处接收到的信号的认知表示为:

其中是窃听信号;为自干扰信号;m∈{1,2,…,M},m为

S-R信道增益一个离散采样;n2为加性高斯白噪声;

由于a对S-R和自干扰信道增益的认知分别为因此,节点R的窃听信干噪比为:

式中N2为高斯噪声的单侧功率谱密度;

假设R-D信道带宽与S-D信道相同,记为Bs,此外,与类似,是一个二维随机变量,取决于a对S-R和自干扰信道增益的认知。

上述的步骤2所述的敌我双方用户在不完全信息条件下通信对抗为如下一个功率域的分层对抗过程:

S-D的行为作为一个领导者,首先采取行动,而我方智能干扰机R是一个跟随者,在S-D后采取行动,具体的:

领导者S执行战术通信并调整其功率策略,其目标是通过降低被干扰机窃听的数据速率来确保安全通信,以及通过提高战术通信容量来面临干扰威胁;

在观察了领导者S的功率策略后,跟随者R释放干扰信号以迫使S增加其发射功率,使R窃听S-D传输,也迫使D以较低的速率接收其预期信号;

智能干扰机R学习S的发射功率,自适应调整其干扰功率,使效用最大化;

此外,敌我双方存在只有不完全的信道条件信息,包括干扰和窃听链路。

上述的步骤2中,基于对自身的和对手的信道认知,通过贝叶斯Stackelberg博弈来描述敌我双方用户在不完全信息条件下通信对抗过程,构建贝叶斯Stackelberg博弈模型,具体的:

节点S的目标是提高S-D战术通信速率,同时以较低的数据传输功率成本降低被R窃听的数据速率,因此,传输节点S的效用与S-D战术通信速率,数据传输功率以及被R窃听的数据速率相关;

将S的效用定义为:

其中,Ds是一个正常数,保证Us为正,可以由S独立自主地确定其取值;为敌方的预期S-D信道容量;是敌方e的预期S-R窃听信道速率;θs是窃听因子,表示敌方对被R窃听的数据速的关注程度;ηsps是在S的功率成本;ηs是在S的单位功率成本;

与S相比,全双工节点R的目的是实现较大的S-R窃听率,并以较低的功率成本降低S-D传输;

将干扰节点R的效用定义为:

其中,Dr是一个正常数,以保证Ur为正;是R的预期窃听速率;是R对S-D的预期信道容量;θr是速率压制因子,用来R关心降低其对手的通信质量的程度,较大的θr说明R更注重压制S-D通信;ηrpr是R的功率成本;ηr为R的单位功率成本;

基于贝叶斯公式,给出的具体定义:

表示a对于在R处接收信干噪比的认知取的值的概率,其中

因此,定义a对于的期望值为:

其中,分别S-D和R-D小信道衰落增益取的概率;

假设是独立的,故

根据的推导,定义窃听率为:

其中,为窃听信干噪比取值的概率,并且

假设是独立的,故分别是S-R和自干扰信道增益取的概率。

上述的步骤3具体包括以下步骤:

步骤3-1:构建优化问题模型:基于R的干扰功率和S的数据传输功率,分别建立跟随者我方智能干扰机R的优化问题模型和领导者S的优化问题模型;

步骤3-2:基于优化问题模型构建Stackelberg均衡,并证明Stackelberg均衡的存在性;

步骤3-3:利用连续凸近似转化优化问题模型的非凸问题,将其分解为一系列子凸函数,通过KKT条件求解子凸函数;

步骤3-4:基于子凸函数的解,采用逆向归纳法求解Stackelberg均衡。

上述的步骤3-1所述构建优化问题模型:基于R的干扰功率和S的数据传输功率,分别建立跟随者我方智能干扰机R的优化问题模型和领导者S的优化问题模型,具体包括:

对于跟随者我方智能干扰机R,定义其优化问题为:

P1:

s.t.0<pr≤pr,max

其中,pr,max为最大干扰功率;

对于领导者S优化问题,由于敌方通信用户的信道期望容量要求大于阈值γ0,即:

由于相对于ps是单调递增的,所以存在ps,min,当ps≥ps,min时,

此外,ps小于最大传输功率ps,max

因此,定义领导者S的优化问题为:

P2:s.t.ps,min<ps≤ps,max

上述的步骤3-2所述基于优化问题模型构建Stackelberg均衡,并证明Stackelberg均衡的存在性,具体包括:

分别表示优化问题P1和P2的解,当满足:

构成Stackelberg均衡;

因此,对上述Stackelberg博弈均衡存在性有以下证明:

跟随者优化问题可以通过连续凸近似为凸形式,因此,它存在一个渐近最优解,记为因此,给定任何S策略ps,以下结论成立:

代入,得到

同理,领导者优化问题可以通过连续凸近似为凸形式,其渐进最优解记为因此,对于给定任何R策略pr,存在代入得到

上述的步骤3-3所述利用连续凸近似转化优化问题模型的非凸问题,将其分解为一系列子凸函数,通过KKT条件求解子凸函数,具体为:

1)问题分解:将P1的效用函数一阶泰勒展开,迭代逼近效用函数的子凸函数:

在每次迭代中,Ur(pr,ps)的近似值表示为:

其中,Θr处的一阶泰勒展开形式,具体为:

其中Φ1处的函数值,Φ2处的一阶导数值;

因此,进一步得到P1的一个近似问题为:

SCP1:

s.t.pr≤pr,max

通过求解SCP1,将新得到的作为下一个泰勒展开点,并开始新的迭代,直到达到最大迭代次数,或者保持不变;

当迭代停止时,最后一迭代轮的pr被赋给

2)子凸问题求解:任何凹函数在任意点处的一展开都是全局上界,因此,U′r(pr,ps)作为原始目标函数Ur(pr,ps)的上界,通过迭代求解SCP1,逐步逼近P1中的原目标函数,从而近似求解P1:

针对子凸优化问题SCP1,引入拉格朗日函数如下:

Lr(pr,ps)=U′r(pr,ps)+λr(pr,max-pr)-μrpr

其中λr和μr为拉格朗日乘数;

由于Lr(pr,ps)为凹函数,因此拉格朗日对偶问题和原问题之间的对偶间隙为零;

然后,在KKT条件下,得到SCP1的解

同理,采取同样的步骤求解P2。

上述的步骤3-4所述基于子凸函数的解,采用逆向归纳法求解Stackelberg均衡,具体求解按如下步骤进行迭代过程:

a)设定S初始迭代功率,S的初始泰勒展开点以及R的初始泰勒展开点;

b)根据S初始迭代功率以及R的初始泰勒展开点求解跟随者子凸函数,得到本轮跟随者子凸函数的解;

c)将上一个跟随者子凸函数的解作为新的一轮泰勒展开点,迭代求解跟随者子凸函数,直到收敛;

d)将最后一轮跟随者子凸函数的解作为输入并通过结合和S的初始泰勒展开点求解领导者子凸函数,得到本轮领导者子凸函数的解;

e)将上一个领导者子凸函数的解作为新的一轮泰勒展开点,迭代求解领导者子凸函数,直到收敛,将S初始迭代功率替换为最后一轮领导者子凸函数的解;

f)重复步骤b)-e),直到收敛,得到Stackelberg均衡解

本发明具有以下有益效果:

本发明研究了一个具有全双工技术的智能干扰机与对方用户之间的对抗博弈,本发明同时干扰与窃听策略具体形式是:智能干扰机释放干扰,来降低敌方的用户数据传输,同时窃听对方的数据传输。为了描述双方在不完全信息条件下的对抗关系,本发明提出了一个功率域的贝叶斯Stackelberg博弈框架模型,通过采用连续凸近似SCA(successiveconvex approximation)转化非凸问题以及KKT(Karush-Kuhn-Tucker)条件求解Stackelberg博弈均衡解,即将通信对抗中如何利用全双工技术,高效地同时实施干扰与窃听的问题构建为贝叶斯Stackelberg博弈模型,进而将转化为博弈优化问题,并通过连续凸近似将领导者与跟随者的非凸优化问题转化,并通过KKT条件求解Stackelberg博弈均衡。

同时本发明证明了所提博弈均衡解的存在并且优于纳什均衡,本发明研究了全双工干扰机速率压制权重和功率成本系数对功率策略和效用的影响。与半双工,单独干扰以及单独窃听方案相比,本发明提出的同时干扰与窃听仿真说明本发明方法具有很好的准确性与收敛性,优于其他方案。

附图说明

图1为本发明的原理图;

图2为敌我双方通信场景图;

图3为连续凸近似方法收敛图;

图4为Stackelberg均衡迭代收敛图;

图5为性能分析图;

图6为几种基准方案的效用对比图。

具体实施方式

以下结合附图对本发明的实施例作进一步详细描述。

本发明实施例建立在图2所示敌我双方用户通信对抗分布情况下。

图1所示为本发明的流程图,本发明一种基于贝叶斯Stackelberg博弈的同时干扰与窃听方法,包括以下步骤:

步骤1:场景建模:建立基于我方智能干扰机与敌方通信用户对的对抗场景模型;

步骤2:博弈建模:基于步骤1的对抗场景模型,利用全双工技术,将敌我双方用户在不完全信息条件下通信对抗建模为贝叶斯Stackelberg博弈模型,确定领导者与跟随者,将同时实施干扰与窃听的问题转化为博弈优化问题,该博弈优化问题为领导者与跟随者的非凸优化问题;

步骤3:优化求解:采用连续凸近似SCA转化领导者与跟随者的非凸优化问题,并通过KKT条件求解贝叶斯Stackelberg博弈均衡解。

实施例中,步骤1所述的对抗场景模型中,博弈双方为我方智能干扰机与敌方通信用户对,其中我方智能干扰机的工作模式是全双工的,可以释放干扰的同时,对敌方通信用户实施窃听,敌方通信用户存在一对通信收发对,实时传输信息,具体的:

以R表示我方智能干扰机的编号,S-D表示敌方通信收发对的编号,在对抗场景中,任意两个节点间的信号传输同时存在路径损耗和小尺度衰落,双方用户很难知道对方确切的信道状态信息,双方用户对小信道衰落持有不完全的认知;

对于同一个信道,需要两个不同的概率来表示信道功率增益的不确定性,用b,e分别表示我方全双工干扰机R和敌方S-D通信对,令a∈(b,e),

其中a对节点x到节点y的小尺度衰落增益的认知集和为:

表示一定概率下第z个小尺度衰落增益取值,z∈{1,2,…,Z}表示集合索引号,节点s,d,r分别表示发射机S、接收机R、全双工节点R;“-”是一个排除运算符;

因此,基于a的认知,节点x到节点y信道增益为:

其中,为自由空间路径损耗,α为路径损耗系数,不失一般性,本发明设为2,dx,y是节点x到节点y的距离;

由于智能干扰机R采用全双工通信方式,会存在一定的自干扰,假设a对于R的自干扰信道增益的认知集为:

其中n∈{1,2,...,N}表示集合索引号,为第n个自干扰衰落增益取值;

因此,基于a的认知,自干扰信道增益定义为:

其中k0为自干扰消除因子。

实施例中,步骤1所述的对抗场景模型中,还定义存在干扰与窃听的对抗场景下的基于认知的信干噪比,具体的:

在S-D战术通信过程中,会受到全双工干扰机R的干扰与窃听,基于a的认知,节点D收到的信号为:

其中为从S接收到的信号;是节点R的干扰信号;i∈{1,2,…,I},i是S与D之间小衰落增益一个离散采样,j∈{1,2,…,J},j为R与D之间的小衰落增益一个离散采样;ps和pr分别是节点S的发射功率和节点R的干扰功率;xs和xr分别为S和R的发射信号;n1为加性高斯白噪声;

因此,a对于节点D处接收信干噪比的认知是一个二维随机变量,取决于a对S-D和R-D信道增益的认知,分别表示为

因此,a认为节点D处接收信干噪比为:

其中,N1为节点D处高斯噪声的单侧功率谱密度;Bs是S-D信道带宽;

为了监视什么战术数据被S发送到它的目标接收者D,全双工节点R窃听S-D传输信号,因此,在R处接收的信号由窃听信号和自干扰信号组成;

因此,a对于R处接收到的信号的认知表示为:

其中是窃听信号;为自干扰信号;m∈{1,2,…,M},m为S-R信道增益一个离散采样;n2为加性高斯白噪声;

由于a对S-R和自干扰信道增益的认知分别为因此,节点R的窃听信干噪比为:

式中N2为高斯噪声的单侧功率谱密度;

不失一般性,假设R-D信道带宽与S-D信道相同,记为Bs,此外,与类似,也是一个二维随机变量,取决于a对S-R和自干扰信道增益的认知。

实施例中,步骤2所述的敌我双方用户在不完全信息条件下通信对抗为如下一个功率域的分层对抗过程:

S-D的行为作为一个领导者,首先采取行动,而我方智能干扰机R是一个跟随者,在S-D后采取行动,具体的:

领导者S执行战术通信并调整其功率策略,其目标是通过降低被干扰机窃听的数据速率来确保安全通信,以及通过提高战术通信容量来面临干扰威胁;

在观察了领导者S的功率策略后,跟随者R释放干扰信号以迫使S增加其发射功率,这有助于R窃听S-D传输,也迫使D以较低的速率接收其预期信号;

智能干扰机R可以快速地学习S的发射功率,自适应调整其干扰功率,使效用最大化;

上述过程可以表述为了一个功率域的分层对抗过程。

此外,敌我双方存在只有不完全的信道条件信息,包括干扰和窃听链路。

实施例中,所述步骤2中,基于对自身的和对手的信道认知,本发明通过贝叶斯Stackelberg博弈来描述敌我双方用户在不完全信息条件下通信对抗过程,构建贝叶斯Stackelberg博弈模型,具体的:

节点S的目标是提高S-D战术通信速率,同时以较低的数据传输功率成本降低被R窃听的数据速率,因此,传输节点S的效用与S-D战术通信速率,数据传输功率以及被R窃听的数据速率相关;

将S的效用定义为:

其中,Ds是一个正常数,保证Us为正,可以由S独立自主地确定其取值;为敌方的预期S-D信道容量;是敌方e的预期S-R窃听信道速率;θs是窃听因子,表示敌方对被R窃听的数据速的关注程度;ηsps是在S的功率成本;ηs是在S的单位功率成本;

与S相比,全双工节点R的目的是实现较大的S-R窃听率,并以较低的功率成本降低S-D传输;

将干扰节点R的效用定义为:

其中,Dr是一个正常数,以保证Ur为正;是R的预期窃听速率;是R对S-D的预期信道容量;θr是速率压制因子,用来R关心降低其对手的通信质量的程度,较大的θr说明R更注重压制S-D通信;ηrpr是R的功率成本;ηr为R的单位功率成本。

实施例中,基于贝叶斯公式,给出的具体定义:

表示a对于在R处接收信干噪比的认知取的值的概率。注意,其中

因此,定义a对于的期望值为:

其中,分别S-D和R-D小信道衰落增益取的概率;

假设是独立的,故

根据的推导,定义窃听率为:

其中,为窃听信干噪比取值的概率,并且

假设是独立的,故分别是S-R和自干扰信道增益取的概率。

步骤3具体包括以下步骤:

步骤3-1:构建优化问题模型:基于R的干扰功率和S的数据传输功率,分别建立跟随者我方智能干扰机R的优化问题模型和领导者S的优化问题模型;

具体的:

构建优化问题模型。在博弈中,R的干扰功率和S的数据传输功率都需要仔细设计。具体来说,

对于R,盲目增加干扰功率会导致严重的自干扰,从而导致窃听速率的下降。因此,R需要调整其功率以实现效用最大化。

另外,对于S,为了抵抗来自R的干扰,盲目增加传输功率会增加更多数据被窃听的风险,增加功率成本。

因此,对于跟随者我方智能干扰机R,定义其优化问题为:

P1:s.t.0<pr≤pr,max

其中,pr,max为最大干扰功率;

对于领导者S优化问题,由于敌方通信用户的信道期望容量要求大于阈值γ0,即:

由于相对于ps是单调递增的,所以存在ps,min,当ps≥ps,min时,

此外,ps小于最大传输功率ps,max

因此,定义领导者S的优化问题为:

P2:

s.t.ps,min<ps≤ps,max

步骤3-2:基于优化问题模型构建Stackelberg均衡,并证明Stackelberg均衡的存在性:

在博弈中,对抗双方都是智能的,因此,双方功率策略是相互影响的。

R作为一个跟随者,可以利用智能传感器以及和定位装置快速观测对手的策略并调整其功率,以使其效用最大化。

S作为领导者,能够预测跟随者R的功率策略,并根据预测做出决策。

分别表示优化问题P1和P2的解,当满足:

这说明R和S不能单方面改变它们的功率,否则它们的效用会下降,此时,

构成Stackelberg均衡;

因此,对上述Stackelberg博弈均衡存在性有以下证明:

跟随者优化问题可以通过连续凸近似为凸形式,因此,它存在一个渐近最优解,记为因此,给定任何S策略ps,以下结论成立:

代入,可得到

同理,领导者优化问题可以通过连续凸近似为凸形式,其渐进最优解记为因此,对于给定任何R策略pr,存在代入得到

步骤3-3:利用连续凸近似转化优化问题模型的非凸问题,将其分解为一系列子凸函数,通过KKT条件求解子凸函数。

P1的目标函数是非凸的,因此求解P1是具有难度的。为了有效地解决这一问题,本发明利用连续凸近似将非凸的P1分解为一系列子凸函数。

其基本思想是用子凸函数逼近原优化问题P1。为了求解P1,需要以下两步:

1)问题分解。将P1的效用函数一阶泰勒展开,本发明迭代逼近效用函数的子凸函数。在每次迭代中,Ur(pr,ps)的近似值可以表示为

其中,Θr处的一阶泰勒展开形式,具体为

其中Φ1处的函数值,Φ2处的一阶导数值。因此,进一步得到P1的一个近似问题为

SCP1:

s.t.pr≤pr,max

通过求解SCP1,将新得到的作为下一个泰勒展开点,并开始新的迭代,直到达到最大迭代次数,或者保持不变。当迭代停止时,最后一迭代轮的pr被赋给

2)子凸函数求解。任何凹函数在任意点处的一展开都是全局上界。因此,U′r(pr,ps)作为原始目标函数Ur(pr,ps)的上界。通过迭代求解SCP1,可以逐步逼近P1中的原目标函数,从而近似求解P1。

针对子凸优化问题SCP1,引入拉格朗日函数如下:

Lr(pr,ps)=U′r(pr,ps)+λr(pr,max-pr)-μrpr

其中λr和μr为拉格朗日乘数。

由于Lr(pr,ps)为凹函数,因此拉格朗日对偶问题和原问题之间的对偶间隙为零;然后,在KKT条件下,得到SCP1的解

同理,采取同样的步骤求解P2。

步骤3-4:基于子凸函数的解,采用逆向归纳法求解Stackelberg均衡。

具体求解按如下步骤进行迭代过程:

a)设定S初始迭代功率,S的初始泰勒展开点以及R的初始泰勒展开点;

b)根据S初始迭代功率以及R的初始泰勒展开点求解跟随者子凸函数,得到本轮跟随者子凸函数的解;

c)将上一个跟随者子凸函数的解作为新的一轮泰勒展开点,迭代求解跟随者子凸函数,直到收敛;

d)将最后一轮跟随者子凸函数的解作为输入并通过结合和S的初始泰勒展开点求解领导者子凸函数,得到本轮领导者子凸函数的解;

e)将上一个领导者子凸函数的解作为新的一轮泰勒展开点,迭代求解领导者子凸函数,直到收敛,将S初始迭代功率替换为最后一轮领导者子凸函数的解;

f)重复步骤b)-e),直到收敛,得到Stackelberg均衡解

基于表1和表2数值进行仿真分析:

表1

表2

图3示出了本发明采用的连续凸近似的收敛过程。可以看到,当收敛到第10次左右时,不论是R的干扰功率,还是S的发射功率都达到收敛,体现了本发明采用的方法具有很好的收敛性,能够加速对抗双方的决策速度。

图4示出了本发明在求解Stackelberg均衡时的迭代过程。可以看到,Stackelberg均衡在求解的过程,在第7次迭代时,双方已经完成收敛,此时双方都不会轻易改变自己的决策,效用达到最大。同时,双方的收敛结果满足本发明设定的功率约束,说明了本发明采用方法的有效性。

图5示出了本发明所采用的方法获得的效用值与实际中没有近似的效用值,以及纳什均衡的比较。可以看到,不论功率压制因子以及功率成本如何取值,本发明所采用的方法与实际的效用值十分接近,说明本发明采用方法近似的可靠性与准确性。同时,双方的效用都优于纳什均衡的效用值,说明了Stackelberg均衡的优势性。

图6示出了本发明采用的同时干扰与窃听方法与其他几种基准方案的对比。可以看到,随着功率压制因子的增大,不论哪种方案,R的效用都会降低。这是因为随着功率压制因子的增大,R会更注重对敌方的干扰压制,会增加己方的干扰功率。因为干扰功率的增加,自干扰以及功率成本都会随之增加导致了效用的增加。此外,不论功率压制因子如何取值,本发明采用的同时干扰与窃听方法都会优于其他几种基准方案,说明了同时干扰与窃听方法的必要性。

以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。

27页详细技术资料下载
上一篇:一种医用注射器针头装配设备
下一篇:物联网中的操作电子设备、管理电子设备和通信方法

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!