SemanticCommunication/paper/03_system_model.md

167 lines
22 KiB
Markdown
Raw Permalink Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 第三章:系统模型 (System Model)
在本章中,我们将详细介绍面向语义-比特混合通信的单小区下行正交频分多址接入Orthogonal Frequency Division Multiple Access, OFDMA系统模型。系统建模主要包括网络拓扑与物理资源设定、射频空间信道衰落特征、异构流量的通信物理过程以及适用于混合架构的统一用户体验质量Quality of Experience, QoE评估指标。通过建立严密且符合物理规律的数学模型我们为后续章节中的多维资源联合分配与优化算法设计奠定坚实的理论基础。
## A. 网络模型 (Network Model)
考虑一个典型的单小区下行链路 OFDMA 通信系统。在系统的几何中心部署了一个配置单天线的宏基站Base Station, BS旨在为覆盖范围内的 $K$ 个单天线移动用户设备提供下行数据传输与智能信息交互服务。
[图1: 语义-比特混合通信单小区下行链路 OFDMA 系统模型示意图]
在这个异构网络中,为了适应未来 6G 网络中极为多样化的业务需求,我们将接入网络的用户划分为两类不同的群体:
第一类为**传统比特通信用户**Bit-based Communication Users其数量记为 $K_b$。此类用户主要承载对数据完整性和精确度要求极高的传统数字流,例如底层控制信令、精密仪器遥测数据或传统的可执行文件下载。
第二类为**语义通信用户**Semantic Communication Users其数量记为 $K_s$。此类用户在终端设备上执行特定的人工智能任务(如自然语言理解、智能对话或图像识别),它们利用基于深度神经网络的语义收发机架构提取并传输信息的核心“语义”,而无需像传统通信那样逐比特精确恢复原始的底层二进制数据。
系统服务中的总用户数满足 $K = K_s + K_b$。我们定义传统比特通信用户集合为 $\mathcal{K}_b = \{1, 2, \dots, K_b\}$,语义通信用户集合为 $\mathcal{K}_s = \{K_b+1, K_b+2, \dots, K\}$,系统中所有处于活跃状态的用户总集合则记为 $\mathcal{K} = \mathcal{K}_b \cup \mathcal{K}_s$。
在物理资源层面,系统在射频频段拥有总带宽为 $B$ 的可用可用频谱资源。该连续频段被均匀且不重叠地划分为 $N$ 个相互正交的子载波Subcarriers构成系统的子载波集合 $\mathcal{N} = \{1, 2, \dots, N\}$。每个子载波的物理带宽(即子载波间隔)均为 $\Delta f = B/N$。
为了进行精细化的频域资源调度,我们定义一个二元指示变量 $\alpha_{k,n} \in \{0, 1\}$ 来表示特定子载波的分配状态:
$$
\alpha_{k,n} = \begin{cases}
1, & \text{如果子载波 } n \text{ 被分配给用户 } k \\
0, & \text{否则}
\end{cases} \quad (1)
$$
公式(1)通过离散的数学形式表达了网络在频域的资源调度决策。为了保证不同用户之间在频域上保持绝对正交从而在理论上完全消除同小区内的用户间干扰Inter-User Interference, IUI我们对资源调度过程施加独占性的子载波分配约束
$$
\sum_{k \in \mathcal{K}} \alpha_{k,n} \leq 1, \quad \forall n \in \mathcal{N} \quad (2)
$$
公式(2)的物理含义非常明确:在任何一个正交频分复用的时隙内,全系统中的每一个子载波 $n$ 最多只能分配给唯一一个用户进行数据传输,同时该子载波也被允许保留在未分配的静默闲置状态。
此外,基站侧受限于射频前端硬件(如功率放大器线性区)和热功耗的物理条件,具有严格的最大发射功率限制,记为 $P_{\max}$。令 $p_{k,n}$ 表示基站在子载波 $n$ 上向目标用户 $k$ 发送无线信号时所分配的实际发射功率,发射功率必须满足非负性:
$$
p_{k,n} \geq 0, \quad \forall k \in \mathcal{K}, n \in \mathcal{N} \quad (3)
$$
该公式表示基站向任何载波注入的射频能量不能为负值。同时,基站在整个工作频带上分配的功率总和绝不能超过其物理允许的阈值上限,即总功率约束:
$$
\sum_{k \in \mathcal{K}} \sum_{n \in \mathcal{N}} p_{k,n} \leq P_{\max} \quad (4)
$$
公式(4)反映了基站侧总发射能量是受限的稀缺资源,需要在不同用户和各频带之间进行合理的均衡分配以实现系统效用最大化。
## B. 信道模型 (Channel Model)
本小节阐述无线射频信号在从基站天线传播至各远端用户过程中的信道衰落物理特性。为了准确刻画高度拥挤且遮挡严重的现代化城市通信环境,我们采用 3GPP 国际标准化组织定义的城市微蜂窝Urban Micro, UMi信道模型来计算信号的大尺度路径损耗。
记系统中用户 $k$ 到中央基站的三维欧式物理直线距离为 $d_k$单位为米。信号在自由空间与建筑物间反射衍射所经历的综合路径损耗Path Loss$\text{PL}(d_k)$ 以分贝dB为物理单位可以表示为
$$
\text{PL}(d_k) = 36.7 \log_{10}(d_k) + 22.7 + 26\log_{10}(f_c) \quad (5)
$$
其中,$f_c$ 表示通信系统的中心载波频率(单位为 GHz。公式(5)定量刻画了高频电磁波在复杂城市建筑群和街道峡谷中传播时,由于距离延长和载频升高而导致的确定性大规模能量耗散规律。
在微观层面考虑到丰富的多径效应Multipath Effect会导致显著的小尺度衰落Small-scale Fading我们将基站到用户 $k$ 在子载波 $n$ 上的复数信道状态增益记为 $h_{k,n}$。由于在城市密集区通常不存在基站与用户间的完美视距路径Non-Line-of-Sight, NLOS我们建模小尺度衰落服从典型的瑞利Rayleigh分布因此 $h_{k,n}$ 被表征为一个零均值的复高斯随机变量:
$$
h_{k,n} \sim \mathcal{CN}(0, 10^{-\text{PL}(d_k)/10}) \quad (6)
$$
公式(6)表明,小尺度信道衰落系数 $h_{k,n}$ 对应的信号方差(即平均信道能量增益)等同于经过大尺度路径损耗衰减后的平均剩余能量。这为物理层的包络畸变提供了概率学基础。
**Assumption 1 (块衰落信道假设):** 在我们的系统建模中假设多径无线信道表现为准静态的块衰落Block Fading特性。这意味着在每一个资源调度周期的时隙Time Slot所有活跃用户在所有子载波上的信道状态信息Channel State Information, CSI保持绝对恒定但在不同时隙之间会根据瑞利分布发生独立的随机更迭。
在信号接收端,用户 $k$ 的射频前端在子载波 $n$ 上接收到的有用信号不可避免地会受到加性高斯白噪声Additive White Gaussian Noise, AWGN的污染。基于热噪声物理机制该子载波频段上的本地噪声功率为
$$
\sigma^2 = N_0 \Delta f \quad (7)
$$
其中 $N_0$ 表示接收机射频前端有效热噪声的功率谱密度Power Spectral Density, PSD。公式(7)说明了在带宽一定的子载波内所累积的本底噪声功率与其子频带宽度之间呈现严格的正比例关系。
综合上述传播规律与噪声机理,当基站以功率 $p_{k,n}$ 经由子载波 $n$ 向目标用户 $k$ 发送调制信号时用户接收端在基带处理前的接收信噪比Signal-to-Noise Ratio, SNR数学定义为
$$
\gamma_{k,n} = \frac{p_{k,n} |h_{k,n}|^2}{\sigma^2} \quad (8)
$$
公式(8)的物理含义极为核心:它表示接收端真实获取的有用信号功率(由发射功率通过衰落信道后决定)与底层背景热噪声功率的绝对比值,该参数直接决定了物理层在特定频点上无误传输数据的潜力与鲁棒性。
## C. 通信模型 (Communication Models)
考虑到异构网络中两类用户呈现出截然不同的数据处理范式和应用需求,我们有必要分别建立各自独立的通信理论模型,以区分香农无损比特传输与深度学习语义特征传输在物理链路层面的差异。
### C.1 传统比特通信模型 (Traditional Bit Communication Model)
对于属于集合 $\mathcal{K}_b$ 的传统比特通信用户,系统严格遵循经典香农信息论的基本准则,致力于实现无误差的底层比特流传输。在离散的 OFDMA 架构下,用户 $k \in \mathcal{K}_b$ 通过汇聚基站分配给它的所有正交子载波上的传输容量其在当前时隙内的可达数据传输速率Achievable Data Rate计算如下
$$
R_k^{(b)} = \sum_{n=1}^{N} \alpha_{k,n} \Delta f \log_2(1 + \gamma_{k,n}) \quad (9)
$$
公式(9)表示传统用户的总网络下行速率是其所独占的各个子载波上的香农信道容量的线性叠加,其物理含义是在现有的无线电波环境和功率分配下,单位时间内系统能够为该类用户进行无失真传输的最大理论比特数量。
同时,由于传统用户通常承载不可容忍长期拥塞的刚性数据业务(如自动驾驶控制指令或高实时后台同步数据),网络必须保障其最基础的通信服务质量。为此,每一个传统用户 $k \in \mathcal{K}_b$ 都向基站申报一个最低下行速率需求 $R_k^{\text{req}}$。倘若通过分配带来的实际速率 $R_k^{(b)}$ 无法跨越该刚性阈值,将直接导致该用户的上层业务连接中断或产生不可逆的超时故障。
### C.2 语义通信模型 (Semantic Communication Model)
与传统通信专注于僵化地精准重建每一个二进制比特不同,处于集合 $\mathcal{K}_s$ 中的语义通信用户重点关注信息源中隐含的“含义”或“意图”在接收端的成功传递与复现。在这里,我们引入了典型的端到端联合信源-信道编码Joint Source-Channel Coding, JSCC神经架构——这一架构大量参考了业内广为接受的 DeepSC [1] 范式——专门用来对非结构化的语义特征进行深度的表征与映射。
具体流程而言,考虑基站当前需要向目标语义用户 $k$ 发送一段包含特定含义的源文本信息向量 $\mathbf{s}$。在发射端基带阶段,基站不再使用传统的信源和信道编码级联模块,而是利用一个预先在海量语料库上训练成熟的深度学习语义编码器 $f_{\theta_e}(\cdot)$(其中 $\theta_e$ 为该神经网络的可学习权重参数),将原始文本序列直接映射为物理层传输所需的连续复数域语义符号向量:
$$
\mathbf{x} = f_{\theta_e}(\mathbf{s}) \in \mathbb{C}^{L_s} \quad (10)
$$
公式(10)定义了神经网络参与的联合语义编码过程,其物理含义是通过多层自注意力机制提取源文本在语法树层面的深层网络特征,并将其密集地映射为适合在无线信道波形上调制的复基带符号 $\mathbf{x}$,其中所生成的符号长度维度被记为 $L_s$。
该语义符号向量 $\mathbf{x}$ 在越过空口进行传输时,必然会经历瑞利信道多径衰落和热噪声的干扰,最终抵达终端用户天线。用户端的复基带接收信号 $\hat{\mathbf{x}}$ 可以用线性代数方程表示为:
$$
\hat{\mathbf{x}} = \mathbf{H} \mathbf{x} + \mathbf{n} \quad (11)
$$
在该线性模型中,$\mathbf{H}$ 表示相应的对角信道衰落增益矩阵,$\mathbf{n} \sim \mathcal{CN}(\mathbf{0}, \sigma^2 \mathbf{I})$ 则表示空间中独立同分布的加性高斯白噪声向量。公式(11)生动地描述了高维语义符号在恶劣物理传输介质中受损与畸变的自然物理过程。
在终端侧,目标用户 $k$ 捕获到失真的符号序列 $\hat{\mathbf{x}}$ 之后,调用与基站联合配对优化的语义解码器 $f_{\theta_d}(\cdot)$(参数矩阵为 $\theta_d$)尝试穿透噪声干扰并重建源信息的初始语义内容,最终输出恢复的估计文本序列 $\hat{\mathbf{s}}$
$$
\hat{\mathbf{s}} = f_{\theta_d}(\hat{\mathbf{x}}) \quad (12)
$$
公式(12)反映了基于深度网络前向传播的语义解码逆映射过程,即从含有不可避免噪声的物理空间复数特征中,重新抽取出具有人类逻辑理解意义的离散词汇序列。
为了科学量化这类智能语义传输范式的实际准确性我们摒弃了缺乏语义表征能力的传统误比特率BER转而采纳更为先进的句子级语义相似度Sentence Similarity, SSim作为语义保真度Semantic Fidelity的核心评判度量。SSim 评分借助目前占据主导地位的预训练自然语言处理庞大模型(例如 BERT 模型网络),抽取源文本 $\mathbf{s}$ 和重建出的文本 $\hat{\mathbf{s}}$ 的高维句法嵌入向量表示,并计算此两者在多维流形空间内的余弦相似度夹角:
$$
\text{SSim}(\mathbf{s}, \hat{\mathbf{s}}) = \frac{\mathcal{E}(\mathbf{s}) \cdot \mathcal{E}(\hat{\mathbf{s}})}{\|\mathcal{E}(\mathbf{s})\| \|\mathcal{E}(\hat{\mathbf{s}})\|} \quad (13)
$$
其中函数 $\mathcal{E}(\cdot)$ 充当标准化的语句特征提取算子。公式(13)具有高度直观的物理意义:其计算结果的分值域严格限定在 $[0,1]$ 之间,得分越逼近自然数 1说明源头意图与终端解码的语篇在人类或机器的高阶认知层面上越加吻合即便某些具体的字面单词并不全然一致例如“轿车”与“汽车”的同义替换
与传统通信相比语义系统在架构上的一大颠覆性优势在于它能够剔除语境冗余并对重要知识进行极度浓缩从而显著降低空口资源所承载的符号长度。为此我们正式定义语义压缩比Semantic Compression Ratio物理量 $\rho$
$$
\rho = \frac{L_s}{L_{\text{raw}}} \quad (14)
$$
其中分母 $L_{\text{raw}}$ 是在同样的下行传输任务中,若采用香农传统通信范式(通过如 Huffman 熵编码加上诸如 QAM 调制等手段)将相同文本 $\mathbf{s}$ 转化为等效物理复数符号所需的总数量标准线。公式(14)衡量了新式语义编码器对于无线信道资源占用的相对压缩强度。在物理意义上,$\rho$ 越趋向于 0说明神经网络的特征蒸馏越剧烈消耗的空口时间或频带资源越少频谱效率提升越显著。
**关键建模 (Critical Modeling of Semantic Performance)**
由于基于多层非线性映射构建的深度学习系统表现如同缺乏明确内生表达式的黑盒结构,想要如同香农极限那样推导出精确解析解是一项近乎不可能的学术挑战。然而,通过海量蒙特卡洛仿真实验和真实数据集回归结果(例如 DeepSC 的开源测试),业界已形成明确共识:在网络拓扑确定的情况下,语义用户最终获取的语义相似度体验水平 $\text{SSim}$ 主要由两项综合性物理变量支配——网络底层的等效信噪比水平以及模型应用端主动选择的语义压缩比。
令 $\mathcal{N}_k = \{n \in \mathcal{N} \mid \alpha_{k,n} = 1\}$ 表示基站调度器分配给特定语义用户 $k$ 的正交子载波全集,利用符号 $|\mathcal{N}_k|$ 来表示该集合中所包含元素的基数大小。借此,我们可以定义用户 $k$ 经历的宏观平均信噪比 $\bar{\gamma}_k$ 为:
$$
\bar{\gamma}_k = \frac{1}{|\mathcal{N}_k|} \sum_{n \in \mathcal{N}_k} \gamma_{k,n} \quad (15)
$$
公式(15)的物理意义是将频域内分散且处于不同独立深衰落状态的各个子载波上的信道质量进行统计学平滑聚合从而用一个标量客观代表整个语义数据传输批次Batch内所面对的综合等效无线传输环境恶劣度。
基于上述聚合参量,用户 $k$ 期望实现的句子级语义相似度即被创造性地抽象化为一个具有两项关键自变量(即平均信噪比 $\bar{\gamma}_k$ 与主动控制压缩比 $\rho_k$)的多元连续可导经验函数:
$$
\text{SSim}_k = \phi(\bar{\gamma}_k, \rho_k) \quad (16)
$$
为了支撑可追溯的凸或非凸数学优化推理,通过对诸如 DeepSC 等神经网络架构在带有高斯噪声与深度瑞利衰落的合成信道下测试的仿真性能数据图表进行高度密集的非线性曲线拟合回归,我们可以采用带有自由度参数控制的通用 Sigmoid 修正变体形式来进行高精度的数学解析近似:
$$
\phi(\bar{\gamma}_k, \rho_k) = 1 - e^{-a(\rho_k) \cdot (\bar{\gamma}_k)^{b(\rho_k)}} \quad (17)
$$
公式(17)完美捕捉了语义信息恢复在随信道状态波动下的特征曲线——典型的“瀑布型下坠效应”。从物理演化规律来看:当可用信噪比水平 $\bar{\gamma}_k$ 充沛并趋近于极大值时,接收端的语义相似度指数将无限次逼近其物理极限 1然而当由于干扰导致信噪比退化时信号解析性能开始呈现类似指数式的非线性恶化断崖下降。
在这一核心公式内部,经验系数 $a(\rho_k) > 0$ 和 $b(\rho_k) > 0$ 是随模型选择的有效压缩比 $\rho_k$ 变化而变化的映射参数组。在物理信息学内涵上,若系统强行选用极低的压缩比进行超高效压缩,为了维持同等的语义高保真水平,用户将不得不面临更苛刻、更严峻的接收信噪比刚性门限。这正是通信物理层面上对模型高维特征压缩效率与系统级抗衰落纠错能力之间基本能量与信息守恒定律的博弈折中表现。
**Assumption 2 (语义性能映射假设):** 在本系统建模框架内,我们声明一项严密的科学假设:假设基站与终端两端部署的巨大神经网络预训练模型参数组 $\theta_e, \theta_d$ 在本轮资源调度长时段内被完全固化;此外,认为公式(17)这种具有平滑可导性质的函数映射方式能够毫无系统性偏见地充分刻画从底层硬件测量出的等效信噪比及软件侧配置压缩比到上端任务评价维度(语义相似度)的刚性确定性传导链条。模型拟合过程中部分由极个别边缘样本文本导致的细微统计残差方差在宏观层面的性能调度建模中将被合理忽略。
## D. 统一体验质量指标 (Unified QoE Metric)
要在异构且共享同一频段的单小区下行系统中,对语义智能设备与传统数字设备实施全局的最优资源调度,网络调度中心必须解决由于两类业务优化维度不同(语义保真度对决客观数据速率)所引发的不同量纲带来的指标割裂障碍。为打破这一不可公度的僵局,我们为该混合网络提出并构建了一个具有统一值域 $[0,1]$ 的规范化体验质量QoE理论评估体系。
针对系统中的各个语义通信用户 $k \in \mathcal{K}_s$,决定其最终综合体验的好坏往往受到两股物理逻辑的牵引:其一是在前端机器智能任务层所能获得的信息语义意图恢复准确度(即极度追求高语义保真度);其二是传输这个语义特征过程中为全系统频谱及能量池所做的轻量化“瘦身”贡献。据此逻辑,语义用户综合 QoE 的评价表达式定界为:
$$
\text{QoE}_k^{(s)} = w_1 \cdot \text{SSim}_k + w_2 \cdot \left( 1 - \frac{\rho_k}{\rho_{\max}} \right) \quad (18)
$$
在表达式中,常量 $\rho_{\max}$ 规定了系统许可架构下所能容忍的最劣质(或称为最高)语义压缩比上限基准(例如设定 $\rho_{\max} = 1.0$ 则意味着等同于不进行任何带有知识提取的深层智能压缩,直接退化为普通网络)。外层设置的归一化相对权重因子 $w_1$ 与 $w_2$ 则始终满足和约束 $w_1 + w_2 = 1$,用于在全局调度控制中平衡服务自身的高精读输出以及对全网络资源节约的公共利益。
公式(18)勾勒出了深刻的系统优化哲理:等式的左半边加权项将最高奖励用于褒奖具备精确无损信息转达的服务,等式的右半边(即所谓的系统级压缩效率奖励项)将倾向于激励网络中的语义节点有意识地选用更为精简且激进的小压缩比向量配置,以此来变相退让并释放那些原本会被冗余词汇强占的宝贵正交子载波资源给同小区的其它高并发用户;依照目前的本文建模偏好考量,我们为这两项指派参数 $w_1 = 0.7, w_2 = 0.3$,从而保证语义意图无损传达的中心主导地位不被动摇。
反观处于系统另一阵营内的传统比特通信用户群 $k \in \mathcal{K}_b$,由于其仅承接对绝对数字精准依赖的确定性非智能业务,其 QoE 是否达标核心落脚于基站实际拨付带宽换算出的数据流量是否成功飞跃了其业务维持的生命线门限。相应地,其体验质量在此被直接定义为一种强制上限截断的非线性速率满意度:
$$
\text{QoE}_k^{(b)} = \min \left( \frac{R_k^{(b)}}{R_k^{\text{req}}}, 1 \right) \quad (19)
$$
公式(19)呈现了一道边界分明的物理屏障:只要由于调度策略恰当使得这名传统用户的物理层可达速率 $R_k^{(b)}$ 恰好触碰到或成功超越了其业务声明的最低速率刚性红线 $R_k^{\text{req}}$,则判定该用户服务连接获取到了极致的完美体验反馈(此时等同于 $\text{QoE}=1$);超出红线之外的闲置溢出速率冗余被视为无效的效用提升。通过 $\min(\cdot, 1)$ 操作函数的引入有效切断了系统中少数强势节点无限贪婪攫取有限频谱功率资源的恶劣途径。若不幸跌落此门限QoE 指数会按比例进行恶性线性扣减惩罚。
汇聚全局视角考虑到下一代面向全场景的人机物三元融合通信愿景均致力于拔高全体网络内接入主体的整体幸福满意均值。最终的系统整体综合体验质量System QoE模型被抽象为全场景下各自用户节点微观个体验的粗略算数平均期望
$$
\text{QoE}_{\text{sys}} = \frac{1}{K} \sum_{k=1}^{K} \text{QoE}_k \quad (20)
$$
在求和执行过程中,变量 $\text{QoE}_k$ 将依靠内部判决引擎依据当前遍历用户的原始类型(语义或者比特)无缝自动跳转对应带入取值 $\text{QoE}_k^{(s)}$ 或者 $\text{QoE}_k^{(b)}$。公式(20)具备宏伟的统筹物理意义:它充当了系统性能评估的中立天平裁判员,量化并监控着该单小区无线网络在这个受到极大峰值发射功率 $P_{\max}$ 物理阻力以及稀缺有限带宽 $B$ 制约的沙盘战场上,同时处理高难度智能压缩与刻板刚性指令这两种极端异构流时所最终能向外界贡献出的总体价值效能积分。在随后的学术章节研究探讨中,正是依托这一被我们精心统一过的最高系统级价值导向函数 $\text{QoE}_{\text{sys}}$,我们将建立起具备实际可行性的大规模多重非凸变量联合优化目标集合,向子载波动态轮换分配、基站天线功率水流控制与语义智能压缩比节点伸缩展开更为精妙和深刻的运筹学统筹算法发掘。
**(本章参考文献占位)**:
[1] H. Xie, Z. Qin, G. Y. Li and B. -H. Juang, "Deep Learning Enabled Semantic Communication Systems," *IEEE Transactions on Signal Processing*, vol. 69, pp. 2663-2675, 2021.