問2

アルファベットが ${1, 2, 3, 4}$ である単純マルコフ情報源の遷移確率行列が

0.5 0 0.5 0 0.5 0.5 0.5 0 000 γ 0 0.5 0 1 - γ

で与えられたとする．ここで, $(i, j)$ 成分は遷移確率 $P (j ∣ i)$ を表し, $0 < γ < 1$ とする．以下の問いに答えよ:

このマルコフ情報源の状態遷移図を図示せよ．
このマルコフ情報源の定常確率分布が $(1/8, 1/4, 1/8, 1/2)$ であるとき, $γ$ の値を求めよ．
(2) が前問で求めた値となるとき、このマルコフ情報源のエントロピー率を求めよ．
このマルコフ情報源に従う確率変数の列 $X_{1}, X_{2}, \dots$ を考える． $X_{i}$ が上述の定常確率分布 $(1/8, 1/4, 1/8, 1/2)$ に従う場合, $(X_{1}, X_{2})$ に対するハフマン符号化を行い, 符号的表示图を示せ．ただし符号語のアルファベットは ${0, 1}$ とする．

中文翻译

给定字母表为 ${1, 2, 3, 4}$ 的简单马尔可夫信息源, 其状态转移概率矩阵如下:

0.5 0 0.5 0 0.5 0.5 0.5 0 000 γ 0 0.5 0 1 - γ

其中 $(i, j)$ 元素表示状态 $i$ 转移到状态 $j$ 的概率 $P (j ∣ i)$ , $0 < γ < 1$ .

绘制该马尔可夫信息源的状态转移图.
假设该马尔可夫信息源的平稳分布为 $(1/8, 1/4, 1/8, 1/2)$ , 求 $γ$ 的值.
在 $γ$ 为前述求得的值时, 计算该马尔可夫信息源的熵率.
假设符号序列 $X_{1}, X_{2}, \dots$ 服从平稳分布 $(1/8, 1/4, 1/8, 1/2)$ , 为 $(X_{1}, X_{2})$ 执行哈夫曼编码, 并绘制编码结果的图. 假设编码字母表为 ${0, 1}$ .

o1

下面给出在修正后转移概率矩阵下的完整解答。修正矩阵为

P = 0.5 0 0.5 0 0.5 0.5 0.5 0 000 γ 0 0.5 0 1 - γ

其中 $P (j ∣ i)$ 是从状态 $i$ 转到 $j$ 的概率。

题目设定：

状态(字母)集合为 ${1, 2, 3, 4}$ 。
给定平稳(定常)分布 $π = (\frac{1}{8}, \frac{1}{4}, \frac{1}{8}, \frac{1}{2})$ 。
需要回答：

状态迁移图
令该链的平稳分布正好是上述 $π$ 时，求 $γ$ 。
用(2)求得的 $γ$ 代入，计算该马尔可夫源的熵率。
若从该马尔可夫源出发，考虑随机变量 $X_{1}, X_{2}, \dots$ 都具有边缘分布 $π$ （题意里说“ $X_{i}$ 服从 $(1/8, 1/4, 1/8, 1/2)$ ”），对取值 ${1, 2, 3, 4}$ 进行 Huffman 编码，并给出编码树(或“符号→码字”的对应)。

1. 状态迁移图

从矩阵的每一行(状态 $i$ )出发，看哪些转移概率为正，即可画出如下有向图(圆圈表示状态，箭头表示可能的转移，标注相应的概率)：

行 1 (i=1):
$P (1 \to 1) = 0.5, P (1 \to 2) = 0.5$ ，其余转移为 0。
即： $1 0.5 1$ 和 $1 0.5 2$ 。
行 2 (i=2):
$P (2 \to 2) = 0.5, P (2 \to 4) = 0.5$ ，其余为 0。
即： $2 0.5 2$ 和 $2 0.5 4$ 。
行 3 (i=3):
$P (3 \to 1) = 0.5, P (3 \to 2) = 0.5$ ，其余为 0。
即： $3 0.5 1$ 和 $3 0.5 2$ 。
行 4 (i=4):
$P (4 \to 3) = γ, P (4 \to 4) = 1 - γ$ ，其余为 0。
即： $4 γ 3$ 和 $4 1 - γ 4$ 。

可以把这几条箭头在纸上连起来，即得到状态迁移图。示意如下（用“→”画出非零概率的方向，并在箭头上标注对应的 0.5、 $γ$ 等）：

 (1) --0.5--> (1)
   \          
    \--0.5--> (2) --0.5--> (2)
                     \            
                      \--0.5--> (4) --(1−γ)--> (4)
                                ^             
                                | γ           
                                (3) <--- 0.5 --- (3本身没有自环)
                                  ^ 
                                  | 0.5
                                  (3)
     (3) --0.5--> (1)
           --0.5--> (2)

(文本示意稍显杂乱，实际作图时更易看清：1 的自环、1→2、2 的自环、2→4、3→1、3→2、4→3、4 的自环。)

2. 由 $π = (1/8, 1/4, 1/8, 1/2)$ 求 $γ$

要让 $π$ 成为该马尔可夫链的平稳分布，需满足

π = π P, 即 π_{j} = i = 1 \sum 4 π_{i} P (i \to j), j = 1, 2, 3, 4.

令 $π = (π_{1}, π_{2}, π_{3}, π_{4}) = (\frac{1}{8}, \frac{1}{4}, \frac{1}{8}, \frac{1}{2})$ 。

(a) 求 $π_{3}$ 对应的方程

π_{3} = i = 1 \sum 4 π_{i} P (i \to 3) .

从矩阵可知：

$P (1 \to 3) = 0$ ,
$P (2 \to 3) = 0$ ,
$P (3 \to 3) = 0$ ,
$P (4 \to 3) = γ$ .

因此

π_{3} = π_{4} γ = \frac{1}{2} γ .

但题目给出 $π_{3} = \frac{1}{8}$ ，故

\frac{1}{8} = \frac{1}{2} γ ⟹ γ = \frac{1}{4} .

(b) 求 $π_{4}$ 对应的方程(验证一致性)

π_{4} = i = 1 \sum 4 π_{i} P (i \to 4) .

从矩阵可读出：

$P (1 \to 4) = 0$ ,
$P (2 \to 4) = 0.5$ ,
$P (3 \to 4) = 0$ ,
$P (4 \to 4) = 1 - γ$ .

所以

π_{4} = π_{2} \cdot 0.5 + π_{4} (1 - γ) = (\frac{1}{4}) \times 0.5 + (\frac{1}{2}) \times (1 - γ) .

题目给定 $π_{4} = \frac{1}{2}$ ，又我们已知 $γ = \frac{1}{4}$ ，代入则

左边 = \frac{1}{2}; 右边 = \frac{1}{4} \times 0.5 + \frac{1}{2} \times (1 - \frac{1}{4}) = \frac{1}{8} + \frac{1}{2} \times \frac{3}{4} = \frac{1}{8} + \frac{3}{8} = \frac{1}{2} .

两边相等，一致。其余 $π_{1}, π_{2}$ 对应的方程也会自动满足。由此可知：

γ = \frac{1}{4} 即可让 π = (1/8, 1/4, 1/8, 1/2) 成为平稳分布。

3. 在 $γ = \frac{1}{4}$ 时，这个马尔可夫源的熵率

马尔可夫链(离散记忆源)的熵率公式为

H (源) = i = 1 \sum 4 π_{i} H (P (\cdot ∣ i)) = i = 1 \sum 4 π_{i} (- j \sum P (i \to j) lo g_{2} P (i \to j)),

其中对 $P (i \to j) = 0$ 的项不计(或视为乘以 0)。下面逐行计算：

行 1: $P (1 \to 1) = 0.5, P (1 \to 2) = 0.5$ 。
分布 $(0.5, 0.5, 0, 0)$ 的熵为
$H_{1} = - (0.5 lo g_{2} 0.5 + 0.5 lo g_{2} 0.5) = 1 bit .$
行 2: $P (2 \to 2) = 0.5, P (2 \to 4) = 0.5$ 。
分布 $(0, 0.5, 0, 0.5)$ 的熵同上，也为
$H_{2} = 1 bit .$
行 3: $P (3 \to 1) = 0.5, P (3 \to 2) = 0.5$ 。
分布 $(0.5, 0.5, 0, 0)$ ，同理也是
$H_{3} = 1 bit .$
行 4: $P (4 \to 3) = γ = \frac{1}{4}, P (4 \to 4) = 1 - γ = \frac{3}{4}$ 。
分布 $(0, 0, \frac{1}{4}, \frac{3}{4})$ 的熵为
$H_{4} = - (\frac{1}{4} lo g_{2} \frac{1}{4} + \frac{3}{4} lo g_{2} \frac{3}{4}) = - (\frac{1}{4} \times (- 2) + \frac{3}{4} lo g_{2} (0.75)) = \frac{1}{2} - \frac{3}{4} lo g_{2} (0.75) .$
数值上， $lo g_{2} (0.75) \approx - 0.4150$ ，
因此
$H_{4} \approx 0.5 - 0.75 \times (- 0.4150) = 0.5 + 0.3113 = 0.8113 bits (左右) .$

将它们按平稳分布加权：

H (源) = π_{1} H_{1} + π_{2} H_{2} + π_{3} H_{3} + π_{4} H_{4} = \frac{1}{8} \times 1 + \frac{1}{4} \times 1 + \frac{1}{8} \times 1 + \frac{1}{2} \times 0.8113 = (\frac{1}{8} + \frac{1}{4} + \frac{1}{8}) \times 1 + \frac{1}{2} \times 0.8113 = \frac{1}{8} + \frac{2}{8} + \frac{1}{8} + 0.40565 = \frac{4}{8} + 0.40565 = 0.5 + 0.40565 = 0.90565 bits (近似) .

如果要求精确到三位小数，可写

H (源) \approx 0.906 bits .

4. 按 $π = (1/8, 1/4, 1/8, 1/2)$ 对 ${1, 2, 3, 4}$ 作 Huffman 编码

题目最后一问常见的作法：

视这 4 个符号(或状态)的出现概率分别为 $p_{1} = \frac{1}{8}, p_{2} = \frac{1}{4}, p_{3} = \frac{1}{8}, p_{4} = \frac{1}{2},$ 进行 Huffman 码的构造。

Huffman 码步骤

列出四个符号及其概率：
$s_{1} = 1, p_{1} = 1/8; s_{2} = 2, p_{2} = 1/4; s_{3} = 3, p_{3} = 1/8; s_{4} = 4, p_{4} = 1/2.$
选出两个最小概率项合并：
- 这里最小的是 $s_{1}$ 和 $s_{3}$ ，各 $1/8$ 。合并得到新节点 $N_{13}$ ，概率 $1/4$ 。
此时剩余的节点概率：
$N_{13} = 1/4, s_{2} = 1/4, s_{4} = 1/2.$
再次选出最小的两项合并(现在 $N_{13}$ 和 $s_{2}$ 并列最小，各 $1/4$ )，合并成新节点 $N_{132}$ ，概率 $1/2$ 。
最后将 $N_{132}$ (概率 $1/2$ ) 与 $s_{4}$ (概率 $1/2$ ) 合并成根节点(概率 1)。由此生成一棵二叉树。若我们一贯约定“左分支标 0，右分支标 1”，可以得到下面的前缀码(只要保证前缀码唯一即可，小的交换并不影响平均长度)。

得到的编码

符号 $4$ ：路径为“根 $\to$ 右”，码字可定为 1。
符号 $2$ ：从根 $\to$ 左 $\to$ 右，码字 01。
符号 $1$ ：从根 $\to$ 左 $\to$ 左 $\to$ 左右再分，实际上更简单写法是：先与 $3$ 合并，再与 $2$ 合并；一种典型的布置是
- $1$ 得码字 000，
- $3$ 得码字 001。

典型 Huffman 编码树可示意为（自上而下）：

       (根)   (概率 1)
       /   \
    0 /     \ 1
     /       \
 (N_{132})   (4)
  (概率1/2)  (概率1/2)
    /   \
  0/     \1
  /       \
(N_{13})  (2)
 (1/4)    (1/4)
  /  \
0/    \1
/      \
(1)    (3)
(1/8)  (1/8)

对应的码字分配(仅举一例)：

$4$ : 1
$2$ : 01
$1$ : 000
$3$ : 001

这样就完成了对 ${1, 2, 3, 4}$ 的 Huffman 编码。在这 4 个符号的概率分布下，该码的平均长度可以算得是最优的。

小结

状态图：根据修正矩阵可见
- $1 \to {1, 2}$ 、 $2 \to {2, 4}$ 、 $3 \to {1, 2}$ 、 $4 \to {3, 4}$ ，
  且相应概率如前。
求得 $γ$ ：令 $π = (1/8, 1/4, 1/8, 1/2)$ 成为不变分布，可解得 $γ = \frac{1}{4}$ 。
熵率：在 $γ = 1/4$ 时，用
$H (源) = \sum_{i} π_{i} H (P (\cdot ∣ i))$
计算可得约 $0.906$ bits。
Huffman 编码：对出现概率 $\frac{1}{2}, \frac{1}{4}, \frac{1}{8}, \frac{1}{8}$ 的 4 个符号，构造出的经典二叉 Huffman 码可为 $4 \mapsto 1, 2 \mapsto 01, 1 \mapsto 000, 3 \mapsto 001.$

My Vault

Explorer

R04-B-問2

問2

中文翻译

o1

1. 状态迁移图

2. 由 $π = (1/8, 1/4, 1/8, 1/2)$ 求 $γ$

(a) 求 $π_{3}$ 对应的方程

(b) 求 $π_{4}$ 对应的方程(验证一致性)

3. 在 $γ = \frac{1}{4}$ 时，这个马尔可夫源的熵率

4. 按 $π = (1/8, 1/4, 1/8, 1/2)$ 对 ${1, 2, 3, 4}$ 作 Huffman 编码

Huffman 码步骤

得到的编码

小结

Graph View

Table of Contents

Backlinks

My Vault

Explorer

R04-B-問2

問2

中文翻译

o1

1. 状态迁移图

2. 由 π=(1/8,1/4,1/8,1/2) 求 γ

(a) 求 π3​ 对应的方程

(b) 求 π4​ 对应的方程(验证一致性)

3. 在 γ=41​ 时，这个马尔可夫源的熵率

4. 按 π=(1/8,1/4,1/8,1/2) 对 {1,2,3,4} 作 Huffman 编码

Huffman 码步骤

得到的编码

小结

Graph View

Table of Contents

Backlinks

2. 由 $π = (1/8, 1/4, 1/8, 1/2)$ 求 $γ$

(a) 求 $π_{3}$ 对应的方程

(b) 求 $π_{4}$ 对应的方程(验证一致性)

3. 在 $γ = \frac{1}{4}$ 时，这个马尔可夫源的熵率

4. 按 $π = (1/8, 1/4, 1/8, 1/2)$ 对 ${1, 2, 3, 4}$ 作 Huffman 编码