5.6 KiB
5.6 KiB
符号表 (Notation Table)
本文件是论文全局符号约定,所有章节必须严格遵循。
系统参数
| 符号 | 含义 | 备注 |
|---|---|---|
N |
OFDMA子载波总数 | 默认 N=64 |
K_s |
语义通信用户数 | |
K_b |
传统比特通信用户数 | |
K = K_s + K_b |
总用户数 | |
B |
系统总带宽 (Hz) | 默认 B = 10 MHz |
\Delta f = B/N |
子载波间隔 | |
P_{\max} |
基站最大发射功率 (W) | 默认 P_{\max} = 1 W (30 dBm) |
\sigma^2 |
加性白高斯噪声功率 | \sigma^2 = N_0 \Delta f |
信道模型
| 符号 | 含义 | 备注 |
|---|---|---|
h_{k,n} |
用户 k 在子载波 n 上的信道系数 |
复数值 |
g_{k,n} = \|h_{k,n}\|^2 |
信道增益 | |
\text{PL}(d_k) |
用户 k 的路径损耗 |
3GPP UMi: \text{PL}(d) = 36.7 \log_{10}(d) + 22.7 + 26\log_{10}(f_c) |
d_k |
用户 k 到基站距离 (m) |
|
f_c |
载波频率 (GHz) | 默认 f_c = 3.5 GHz |
\gamma_{k,n} |
用户 k 在子载波 n 上的信噪比 |
\gamma_{k,n} = p_{k,n} g_{k,n} / \sigma^2 |
资源分配变量
| 符号 | 含义 | 备注 |
|---|---|---|
\alpha_{k,n} \in \{0, 1\} |
子载波分配指示 | \alpha_{k,n}=1 表示子载波 n 分给用户 k |
p_{k,n} \geq 0 |
用户 k 在子载波 n 上的发射功率 |
|
\mathbf{A} = [\alpha_{k,n}] |
子载波分配矩阵 | K \times N |
\mathbf{P} = [p_{k,n}] |
功率分配矩阵 | K \times N |
语义通信模型
| 符号 | 含义 | 备注 |
|---|---|---|
\mathbf{s} |
源语义信息 (文本句子) | |
f_{\theta_e}(\cdot) |
语义编码器 (DeepSC) | 参数 \theta_e |
f_{\theta_d}(\cdot) |
语义解码器 (DeepSC) | 参数 \theta_d |
\mathbf{x} = f_{\theta_e}(\mathbf{s}) |
编码后的语义符号序列 | |
\hat{\mathbf{s}} = f_{\theta_d}(\hat{\mathbf{x}}) |
解码恢复的语义信息 | |
L_s |
语义符号长度 (符号数/句子) | 与压缩比相关 |
\text{BLEU}(\mathbf{s}, \hat{\mathbf{s}}) |
双语评估指标 | 语义保真度度量 |
\text{SSim}(\mathbf{s}, \hat{\mathbf{s}}) |
语义相似度 | 基于句子嵌入的余弦相似度 |
传统比特通信模型
| 符号 | 含义 | 备注 |
|---|---|---|
R_{k}^{(b)} |
用户 k 的可达速率 (bps) |
R_k^{(b)} = \sum_{n} \alpha_{k,n} \Delta f \log_2(1 + \gamma_{k,n}) |
R_k^{\text{req}} |
用户 k 的最低速率需求 |
QoE指标
| 符号 | 含义 | 备注 |
|---|---|---|
\text{QoE}_k^{(s)} |
语义用户 k 的体验质量 |
\text{QoE}_k^{(s)} = w_1 \cdot \text{SSim}_k + w_2 \cdot (1 - L_s/L_{\max}) |
\text{QoE}_k^{(b)} |
传统用户 k 的体验质量 |
\text{QoE}_k^{(b)} = \min(R_k^{(b)} / R_k^{\text{req}}, 1) |
\text{QoE}_{\text{sys}} |
系统整体QoE | \text{QoE}_{\text{sys}} = \frac{1}{K} \sum_{k=1}^{K} \text{QoE}_k |
w_1, w_2 |
语义QoE权重 | w_1 + w_2 = 1, 默认 w_1 = 0.7, w_2 = 0.3 |
Q_{\text{th}} |
QoE切换阈值 | 默认 Q_{\text{th}} = 0.6 |
博弈论与合作竞争
| 符号 | 含义 | 备注 |
|---|---|---|
\lambda(t) \in [0, 1] |
合作-竞争切换因子 | \lambda(t) = \sigma(\beta \cdot (\text{QoE}_{\text{sys}}(t) - Q_{\text{th}})) |
\sigma(\cdot) |
Sigmoid函数 | \sigma(x) = 1/(1+e^{-x}) |
\beta |
切换灵敏度参数 | 默认 \beta = 5 |
\mathcal{G} = \langle \mathcal{N}, \{\mathcal{A}_i\}, \{U_i\} \rangle |
Stackelberg博弈 | |
\mathcal{N} = \{S, B\} |
玩家集合 | S: 语义智能体(Leader), B: 传统智能体(Follower) |
\mathcal{A}_i |
玩家 i 的动作空间 |
|
U_i |
玩家 i 的效用函数 |
|
U_S, U_B |
语义/传统智能体效用 | |
\mathbf{a}_S^*, \mathbf{a}_B^* |
Stackelberg均衡策略 |
MARL相关
| 符号 | 含义 | 备注 |
|---|---|---|
\mathbf{o}_i |
智能体 i 的局部观测 |
\mathbf{o}_i = [h_{i,1}, \ldots, h_{i,N}, \overline{\text{QoE}}_i, \text{param}_i, N_i^{\text{alloc}}, \text{load}_i] |
\mathbf{a}_i |
智能体 i 的动作 |
\mathbf{a}_i = [n_{\text{sub}}, p_{\text{frac}}, m_{\text{param}}] \in [0,1]^3 |
| $\pi_i(\mathbf{a}_i | \mathbf{o}_i; \theta_i^{\mu})$ | 智能体 i 的策略 (Actor) |
Q_i(\mathbf{o}_1, \mathbf{o}_2, \mathbf{a}_1, \mathbf{a}_2; \theta_i^Q) |
智能体 i 的Q函数 (Critic) |
参数 \theta_i^Q, CTDE架构 |
r_i^{\text{coop}} |
合作奖励 | r_i^{\text{coop}} = 0.5 r_i^{\text{self}} + 0.3 r_j^{\text{self}} + 0.2 r^{\text{sys}} |
r_i^{\text{comp}} |
竞争奖励 | r_i^{\text{comp}} = 0.8 r_i^{\text{self}} + 0.2 r^{\text{sys}} |
r_i |
混合奖励 | r_i = \lambda \cdot r_i^{\text{coop}} + (1-\lambda) \cdot r_i^{\text{comp}} |
\gamma |
折扣因子 | 默认 \gamma = 0.95 |
\tau |
目标网络软更新率 | 默认 \tau = 0.01 |
\mathcal{D} |
经验回放缓冲区 | 容量 $ |
定理相关
| 符号 | 含义 | 备注 |
|---|---|---|
U^*_{\text{co}} |
合作竞争均衡效用 | Theorem 1 |
U^*_{\text{coop}} |
纯合作最优效用 | Theorem 2 基准 |
U^*_{\text{comp}} |
纯竞争最优效用 | Theorem 2 基准 |
\mathcal{S}_c |
合作主导状态集 | \{s : U_{\text{coop}}(s) > U_{\text{comp}}(s)\} |
\mathcal{S}_d |
竞争主导状态集 | \{s : U_{\text{comp}}(s) \geq U_{\text{coop}}(s)\} |
\delta_{\min} |
最小模式优势差 | Theorem 2 |
L |
QoE关于 \lambda 的Lipschitz常数 |
Theorem 3, \beta L / 4 < 1 |
\epsilon_Q |
Q函数逼近误差 | Theorem 4 |
T |
训练迭代次数 | Theorem 4 |