本文最后更新于 54 天前，其中的信息可能已经有所发展或是发生改变。

信道容量为什么是通信上限

在信道编码里，我们经常说一句话：容量是信道能支持的可靠通信上限。

这句话背后是 Shannon 信道编码定理。它可以分成两半：

Converse：如果通信速率 $R$ 超过容量 $C$ ，错误概率不可能趋近于 0。
Achievability：如果通信速率 $R$ 小于容量 $C$ ，存在一组编码方案使错误概率趋近于 0。

第一半告诉我们“容量是上限”，第二半告诉我们“这个上限不是空想，而是可以逼近”。下面用尽量少的技术负担，把这两个方向的证明主线走一遍。

模型和符号

考虑一个离散无记忆信道 $W(y\mid x)$ 。每次输入为 $X$ ，输出为 $Y$ 。信道容量定义为：

C=\max_{P_X} I(X;Y)

这里 $P_X$ 是输入分布， $I(X;Y)$ 是输入和输出之间的互信息。直觉上， $I(X;Y)$ 衡量一次信道使用后，输出 $Y$ 平均告诉了我们多少关于输入 $X$ 的信息。

现在连续使用信道 $n$ 次。发送端要发送一个消息 $S$ ，一共有 $M$ 种可能消息。若这些消息等概率出现，则：

H(S)=\log_2 M

通信速率定义为每次信道使用传多少 bit：

R=\frac{1}{n}\log_2 M

所以 $H(S)=nR$ 。编码器把消息 $S$ 映射成长度为 $n$ 的信道输入序列 $X^n=(X_1,\dots,X_n)$ 。信道输出为 $Y^n=(Y_1,\dots,Y_n)$ 。译码器根据 $Y^n$ 给出估计 $\hat{S}$ 。平均错误概率记作：

P_e=\Pr(\hat{S}\ne S)

可靠通信的含义是：当 $n$ 增大时， $P_e$ 可以趋近于 0。

为什么超过容量不可能可靠

证明上限时，关键问题是：如果接收端几乎总能恢复 $S$ ，那么 $Y^n$ 里必须包含足够多关于 $S$ 的信息。

消息本身的信息量是：

H(S)=nR

把它拆成两部分：

H(S)=I(S;Y^n)+H(S\mid Y^n)

这里 $I(S;Y^n)$ 表示接收序列 $Y^n$ 中包含多少关于消息 $S$ 的信息； $H(S\mid Y^n)$ 表示看到了 $Y^n$ 以后，对 $S$ 还剩多少不确定性。

如果译码错误概率很小， $H(S\mid Y^n)$ 也应该很小。这个直觉由 Fano 不等式精确表达：

H(S\mid Y^n)\le h_2(P_e)+P_e\log_2(M-1)

其中 $h_2(P_e)$ 是二元熵函数。为了看清主线，可以用一个更粗但够用的上界：

H(S\mid Y^n)\le 1+P_e nR

因此：

nR\le I(S;Y^n)+1+P_e nR

接下来要限制 $I(S;Y^n)$ 。消息 $S$ 先被编码成 $X^n$ ，再经过信道变成 $Y^n$ 。信息流是：

S\to X^n\to Y^n

由数据处理不等式，处理不会凭空增加关于 $S$ 的信息，所以：

I(S;Y^n)\le I(X^n;Y^n)

又因为信道是无记忆的，长度为 $n$ 的整体互信息不会超过每次使用的互信息之和：

I(X^n;Y^n)\le \sum_{i=1}^{n}I(X_i;Y_i)

而每一项 $I(X_i;Y_i)$ 都不超过单次信道容量 $C$ ，所以：

I(X^n;Y^n)\le nC

把这些不等式串起来：

nR\le nC+1+P_e nR

移项并除以 $n$ ：

(1-P_e)R\le C+\frac{1}{n}

如果一组编码真的可靠，那么当 $n\to\infty$ 时应有 $P_e\to 0$ 。这时上式逼近：

R\le C

这就证明了 converse：任何可靠通信方案的速率都不能超过信道容量。也就是说，容量确实是可靠通信的上限。

为什么低于容量可以可靠

上面的证明只说明了“超过容量不行”。Shannon 定理更强的地方在于：只要 $R<C$ ，可靠通信是可以做到的。

证明思路来自随机编码。选一个输入分布 $P_X$ ，如果它满足：

R<I(X;Y)

那么随机生成 $M=2^{nR}$ 个码字，每个码字按 $P_X$ 独立生成。发送时选中对应码字，接收端根据 $Y^n$ 找最像一起由信道产生的那一个码字。

错误主要来自两类事件：

真实发送的码字和接收序列看起来不匹配。
某个没有发送的码字也和接收序列看起来很匹配。

第一类事件由大数定律控制， $n$ 足够大时概率会很小。第二类事件的数量大约有 $2^{nR}$ 个候选，每个错误候选“撞上”的概率大约是 $2^{-nI(X;Y)}$ 。总的错误风险可以粗略看成：

2^{nR}2^{-nI(X;Y)}=2^{-n(I(X;Y)-R)}

如果 $R<I(X;Y)$ ，这个量会随 $n$ 指数下降。于是平均错误概率可以趋近于 0。

既然容量是所有输入分布下 $I(X;Y)$ 的最大值：

C=\max_{P_X}I(X;Y)

那么只要 $R<C$ ，就可以找到某个输入分布让 $R<I(X;Y)$ ，从而存在可靠编码方案。

这就是 achievability 的核心直觉：容量以下不是只能“希望可靠”，而是确实存在可靠通信方案。

这句话到底证明了什么

把两半合起来，Shannon 信道编码定理说的是：

若 $R<C$ ，存在编码和译码方案，使错误概率随码长增大而趋近于 0。
若 $R>C$ ，不存在这样的可靠通信方案。

所以容量 $C$ 正好是可靠通信速率的边界。

这也解释了为什么编码理论总是在追“接近容量”。一个好码不是随便把错误率压低，而是在给定信道条件下，让码率尽量靠近 $C$ ，同时仍保持足够低的错误概率。

和 Polar 码有什么关系

Polar 码的重要性就在这里。Shannon 定理最早告诉我们：容量以下存在好码。但“存在”不等于“容易构造”。Polar 码的贡献是给出了一条明确路线：通过信道极化，把一批子信道分成越来越可靠和越来越不可靠两类，再把信息比特放到可靠子信道上。

从这个角度看，Polar 码不是在重新定义容量，而是在回答一个更工程的问题：怎样显式构造一类可以逼近容量的码。

小结

“容量是信道能支持的可靠通信上限”不是一句口号。Fano 不等式和数据处理不等式说明：如果错误概率要趋近于 0，速率就不能超过容量。随机编码思想说明：只要速率低于容量，确实可以让错误概率趋近于 0。

因此容量既是上限，也是可逼近的边界。后续学习 Polar 码时，所谓“容量可达”，本质上就是围绕这条边界展开。

参考

C. E. Shannon, “A mathematical theory of communication,” Bell Syst. Tech. J., vol. 27, no. 3, pp. 379-423, Jul. 1948; vol. 27, no. 4, pp. 623-656, Oct. 1948, doi: 10.1002/j.1538-7305.1948.tb01338.x; 10.1002/j.1538-7305.1948.tb00917.x.

T. M. Cover and J. A. Thomas, Elements of Information Theory, 2nd ed. Hoboken, NJ, USA: Wiley-Interscience, 2006.

信道容量为什么是通信上限

模型和符号

为什么超过容量不可能可靠

为什么低于容量可以可靠

这句话到底证明了什么

和 Polar 码有什么关系

小结

参考

发送评论 编辑评论

推荐文章

发送评论编辑评论