3.3.1 问题描述_博弈学习通信抗干扰理论与方法-QQ阅读女生现言网

书名：博弈学习通信抗干扰理论与方法
作者名：贾录良等
本章字数：840字
更新时间：2025-02-27 03:47:26

3.3 离散策略条件下的分层功率控制抗干扰

3.3.1 问题描述

在离散功率策略条件下，假设用户的可用功率策略集为P={p₁ ， p₂ ，…， p_m，…， p_M}，干扰功率策略集为J={φ₁ ，φ₂ ，…，φ_n，…，φ_N}。根据文献[24-25]，基于信干噪比（SINR），用户的效用函数可定义为

式中，为噪声功率；c_s为用户单位发射功率代价；p_m和φ_n分别为用户和干扰的发射功率。相应地，干扰的效用函数可定义为[24-25]

式中， c _j为单位干扰功率代价。与 3.2 节分析类似，在离散功率策略条件下，也可将功率控制抗干扰问题建模为一个 Stackelberg 博弈问题。其中，通信用户假设为领导者，干扰为跟随者。为了叙述方便，下面叙述中用1和2分别表示用户和干扰的标志编号。构建的Stackelberg博弈可以表示为G={N，P， J，μ_s，μ_j}，其中， N={1，2}表示参与者的集合， P和J 分别表示用户和干扰的策略空间，μ_s和μ_j分别表示通信用户和干扰的效用函数。

在一个 Stackelberg 博弈中，考虑到跟随者的不精确观测和有限理性，跟随者会偏离它的最佳策略。为了表征跟随者的不精确观测，引入观测因子γ∈[0，1]，γ越大，表示精确观测的概率越大。当γ=1时，表示跟随者可以完美观测领导者的行为。观测误差矩阵可以建模为

式中，φ_m_，_l为将功率p_m看作p_l的概率。当满足条件m=l时，φ_m_，_m=γ表示干扰可以精确观测用户发射功率p_m的概率；否则，有φ_m_，_l=（1-γ）/（M-1），其中M表示用户发射功率策略的个数。

考虑到干扰的不精确观测特性，式（3-29）所示的干扰效用函数可改写为

对于干扰来说，给定一个用户的功率策略p_m∈P，干扰的优化问题可建模为

由于跟随者的有限理性，即跟随者不是严格地追求效用最大化。受文献[152]的启发，为了表征有限理性的不确定度，引入理性因子η∈[0，1]来表征干扰的理性度。理性因子η越大，表示理性度越高。如果η=1，就表示跟随者是完全理性的。为了分析方便，理性矩阵可定义为

式中，Ψ_w_，_k为功率φ_w被看作功率φ_k的概率。如果满足w=k，Ψ_w_，_w=η表示干扰的理性度；否则，有Ψ_w_，_k=（1-η）/（N-1），其中N表示干扰功率策略的个数。考虑到干扰的有限理性，式（3-28）所示的用户效用函数可改写为

相应地，用户的优化问题可表示为