問2

定常無記憶情報源 を考える。この情報源のアルファベットを有限集合 とし、各 は確率分布 に従うものとする。任意に固定された に対し、系列

を満たすとき、この系列を に関する典型系列であると言う。ここで、 のエントロピーを表し、 は同時確率分布を表す。全ての典型系列からなる集合を と表記する。次の各問いに答えよ。ただし、 とする。ここで は定数である。

  1. に対し、 を求めよ。
  2. () および を求めよ。
  3. に対し、 とおく。 とする。 に属する系列 に対する の範囲を求めよ。

中文翻译

设定常无记忆信息源 ,其字母表为有限集合 ,各 遵循概率分布 。对任意固定的 ,若序列 满足:

则称此序列为 的典型序列,其中 表示 的熵, 表示联合概率分布。所有典型序列的集合记为 。回答以下问题:

  1. 对序列 ,求其
  2. 和联合熵
  3. 对于 ,令 ,已知 ,求属于 的序列 的范围。

o1

以下的推导中,默认对数均为以 2 为底(即 )。若题目中未特别指定底数,信息论中常用 计算熵。


1. 求

给定:

并且 独立同分布(i.i.d.)。
题目中的具体序列是

数一数其中“1”的个数与“0”的个数:

  • “1”的个数 = 3
  • “0”的个数 = 7

由于 相互独立,故该序列的概率为


2. 求

  1. 单个符号的熵

    对伯努利随机变量 (取值 0 或 1),其熵为

    这是标准的 Bernoulli() 熵公式。

  2. 联合熵

    由于 独立同分布(i.i.d.),故其联合熵为


3. 对典型集合中序列的 取值范围

题目给定:

并定义

典型集合 的定义是:

其中


3.1 将不等式转化为“经验分布”形式

。则

记伯努利() 的熵为

则典型集合的条件可写为

从而得到

也就是说,只有当 使得该式在 的范围内成立, 才会落在典型集合里。


3.2 在 时的线性化简

来说,

来算,可得到大约

另一方面,

下其实是一个关于 线性函数(可由数值代入后发现)。
具体计算(保留 4~5 位小数即可):

  • ,
  • .

所以

再核对一下

正好与 符合。


3.3 令该线性函数落入

我们要找所有 使

令此区间为 ,则

  1. 下界 :

  2. 上界 :

因此对于 ,我们得到

最后将 代回:

因为 必须是整数,所以


总结答案

  1. 与联合熵

  2. 典型集合中 的范围
    条件下,属于典型集合 的序列 必须满足