题目

为取值在 中的随机变量。对于参数 ,定义概率如下:


  • 定义二进制熵函数 如下:

问题

  1. 使用二进制熵函数表达条件熵
  2. ,求使相互信息量 最大化的 值,并用二进制熵函数及 表达 的最大值。
  3. 固定 的值(),求使相互信息量 最小化的 值,并表示该最小值。
  4. 固定 的值(),求使相互信息量 最大化的 值。

GPT-4o

解答

1. 使用二进制熵函数表达条件熵

条件熵 表达了在给定 的情况下,随机变量 的不确定性。根据题目中的概率定义,我们可以写出:

根据条件概率的定义,我们知道:

  • 时,
  • 时,
    因此,对于每个条件, 的熵分别为:

其中,二进制熵函数 定义为:

因此,条件熵 为:

其中,,而

2. 若 ,求使相互信息量 最大化的 值,并用二进制熵函数及 表达 的最大值

相互信息量 定义为:

其中, 是条件熵,已在第一部分给出:

的熵,它可以通过求解 来得到。我们首先计算

因此, 为:

结合 ,我们得到相互信息量 为:

现在,要求 最大化。题目中给定了 ,因此我们可以将其代入并进行求解。为了最大化 ,我们需要找到使 最大的 ,而二进制熵函数 时最大。所以,要求:

代入,得到:

解这个方程,得到 的最优值。通过整理:

这给出的是关于 的关系。为了进一步分析,可以根据具体的 值来求解


3. 固定 ,使 最小化

问题 3:固定 ,求使 最小化的

我们从相互信息的定义出发:

其中:

边缘熵 计算如下:

因此,相互信息为:

条件 1:最小化

要使 最小化,可以通过调整 来让 的差最小。

  • 时: 此时: 相互信息:

结论:

时,相互信息 取得最小值,且最小值为:


4. 固定 ,使 最大化的

相互信息最大化的关键是调整 使 的差最大化。为此,我们需要最大化 并最小化

条件 1:最小化

应选择使 最小,即:

此时 ,有:

条件 2:最大化

时:

  • ,则
  • ,则
    我们选择 使 接近 0.5,从而使 最大化。

结论:

  • 固定 ,若 ,使 最大化的 为: 最大相互信息量为: