- 博弈学习通信抗干扰理论与方法
- 贾录良等
- 1611字
- 2025-02-27 03:47:26
3.2.2 博弈均衡分析与求解
1.下层子博弈
在3.2.1节建模的抗干扰Stackelberg功率控制博弈中,干扰作为跟随者需要估计用户的发射功率策略,不精确的估计可能产生观测误差。与文献[25]类似,干扰的观测误差可定义为ε=|P~-P|/P,其中P~表示干扰对用户发射功率的观测值。干扰追求自身效用的最大化,考虑到发射链路信道增益α和干扰功率代价Cj的不确定性,干扰的优化问题可建模为

式中, JM为干扰的最大干扰功率。根据上述优化问题,最佳干扰功率为

对于干扰来说,假设随机变量α和Cj相互独立。随机变量α的 M 个状态分别是α1,…,αm,…,αM,其概率分布为φ1,…,φm,…,φM,并满足。随机变量Cj的W个状态分别是Cj1,…,Cjw,…,CjW,其概率分布为к1,…,кw,…,кW,并满足
。
通过求解式(3-5)和式(3-6)构成的优化问题,干扰可以获得推论3.1所示的最佳功率策略。
推论3.1:干扰的最佳功率策略为

其中,(.)+□max(.,0)。如果用户的发射功率太小(例如,,那么干扰功率为0,不再进行干扰。
证明:根据文献[24-25]中的论述,由于满足

因此,干扰的效用函数是干扰功率J的凹函数,式(3-5)和式(3-6)组成的优化问题为一个凸优化问题。基于对偶优化理论[46-147-149],可以得到最佳干扰策略。首先,通过引入非负对偶变量λ,式(3-5)和式(3-6)所组成优化问题的拉格朗日函数为

拉格朗日对偶函数为

相应的对偶问题为

根据库恩-塔克(Karush-Kuhn-Tucker,KKT)条件,可得

根据式(3-13),可以得到。由于式(3-5)和式(3-6)组成的优化问题是一个凸优化问题,强对偶条件成立。因此,对偶间隙为零,对偶问题的最优解即为原问题的最优解。
证毕。
2.上层子博弈
考虑到干扰链路信道增益β和用户发射功率代价Cs的不确定性,用户的最佳功率策略可以通过求解下面的优化问题得到。

其中, PM表示用户的最大发射功率, J (P)如式(3-8)所示。用户的最佳发射功率为

对于用户来说,假设随机变量β和Cs相互独立。随机变量β的 R 个状态分别为β1,…,βr,…,βR,其概率分布为ρ1,…,ρr,…,ρR,并满足。随机变量Cs的H个状态分别为Cs1,…,Csh,…,CsH,其概率分布为g1,…,gh,…,gH,并满足
。
推论3.2:用户的最佳功率策略为

其中,。
证明:将式(3-8)代入式(3-3),可以得到

其中,。
根据式(3-18),当满足条件P≤Λ时,用户的效用函数是发射功率P的线性函数。当满足条件P>Λ时,由于满足

因此,用户的效用函数是发射功率P的凹函数。
通过引入非负对偶变量μ,式(3-14)和式(3-15)所组成优化问题的拉格朗日函数为

类似于下层子博弈的分析过程,可得用户的最佳发射功率为

根据式(3-18),可分以下几种情况进行讨论:
情况1:。
在这种情况下,满足条件Λ≤Popt。用户效用函数时获得最大值。
情况2:。
在这种情况下,满足条件Λ>Popt。用户效用函数时获得最大值。
情况3:。
在这种情况下,满足条件P≤Λ,用户效用函数是发射功率P的单调递减函数。用户效用函数
时获得最大值。
证毕。
对偶变量λ和μ可通过次梯度法进行更新。

式中,n为迭代次数;和
均为迭代步长。
3.Stackelberg均衡分析
根据文献[44],Stackelberg均衡可定义如下。
定义3.1:如果对于P≥0和J≥0,满足条件

那么最佳策略集合( P*, J*)构成所提博弈的 Stackelberg 均衡(Stackelberg Equilibrium,SE)。
推论3.3:所提抗干扰贝叶斯Stackelberg博弈总是存在一个SE解。
证明:给定一个用户的发射功率策略P,则有以下两种情况。
(1)干扰的策略空间{J∶0≤J≤J M}是欧式空间上的非空凸紧子集。
(2)效用函数是干扰功率J的连续凹函数。
基于文献[150]中的论述,在下层子博弈中存在一个 NE 解,NE(P)表示在给定用户发射功率P时的最佳响应。定义3.1中的SE可等价定义为

因此,存在P*满足

因而,所提抗干扰贝叶斯Stackelberg博弈总是存在SE解。
证毕。
推论3.4:所提抗干扰贝叶斯Stackelberg博弈存在唯一的SE解。
证明:根据式(3-9),满足条件。在给定用户发射功率 P 的条件下,干扰的效用函数
是干扰功率J的凹函数。因此,干扰存在唯一的最佳策略NE(P*)。
根据推论 3.2,用户存在唯一的最佳发射功率策略P*。因此,所提的抗干扰贝叶斯Stackelberg博弈存在唯一的SE解。
证毕。