信源编码定理



离散无记忆信源产生的代码必须有效地表示,这是通信中一个重要的问题。为此,存在表示这些信源代码的码字。

例如,在电报中,我们使用莫尔斯电码,其中字母由表示。如果考虑使用频率最高的字母E,则用“.”表示,而很少使用的字母Q则用“--.-”表示。

让我们看一下框图。

Block Diagram

其中Sk是离散无记忆信源的输出,bk是信源编码器的输出,用01表示。

编码序列便于接收端解码。

假设信源的字母表有k个不同的符号,第k个符号Sk出现的概率为Pk,其中k = 0, 1…k-1

设编码器为符号Sk分配的二进制码字长度为lk(以比特为单位)。

因此,我们将信源编码器的平均码字长度L定义为

$$\overline{L} = \displaystyle\sum\limits_{k=0}^{k-1} p_kl_k$$

L表示每个信源符号的平均比特数。

如果 $L_{min} = \: \overline{L}的最小可能值$

编码效率可以定义为

$$\eta = \frac{L_{min}}{\overline{L}}$$

由于$\overline{L}\geq L_{min}$,我们将有$\eta \leq 1$

然而,当$\eta = 1$时,信源编码器被认为是有效的。

为此,必须确定$L_{min}$的值。

让我们参考定义:“给定一个熵为$H(\delta)$的离散无记忆信源,任何信源编码的平均码字长度L都受限于$\overline{L} \geq H(\delta)$。”

简单来说,码字(例如,QUEUE的莫尔斯电码是-.- ..- . ..- .)总是大于或等于信源代码(例如QUEUE)。这意味着码字中的符号大于或等于信源代码中的字母。

因此,当$L_{min} = H(\delta)$时,根据熵$H(\delta)$,信源编码器的效率可以写成

$$\eta = \frac{H(\delta)}{\overline{L}}$$

此信源编码定理称为无噪声编码定理,因为它建立了无错误编码。它也称为香农第一定理

广告