定义

偏度是统计学中用于衡量随机变量概率分布不对称性的数字特征。它描述了分布偏离对称性的程度和方向。

对于一个随机变量 ,若其均值为 ,标准差为 ,则偏度 定义为三阶标准中心矩:

其中 的三阶中心矩。

计算

总体偏度

对于总体数据,偏度计算公式为:

样本偏度

对于样本数据,常用的无偏估计量为:

更精确的调整公式(如Fisher-Pearson系数):

偏度的类型

正偏态(右偏)

  • 偏度 > 0
  • 分布右侧有长尾,均值 > 中位数 > 众数
  • 例子:个人收入分布(少数高收入者拉长右侧尾部)

负偏态(左偏)

  • 偏度 < 0
  • 分布左侧有长尾,均值 < 中位数 < 众数
  • 例子:考试分数分布(多数学生得分较高,少数低分拉长左侧尾部)

对称分布

  • 偏度 ≈ 0
  • 分布基本对称,均值 = 中位数 = 众数
  • 例子:正态分布、均匀分布

可视化示例

正偏态(右偏):
      ▲
      │      •
      │    •  •
      │  •    •
      │ •     •
──────•───────────►
    众数 中位数 均值

负偏态(左偏):
        ▲
        │ •
        │ • •
        │•   •
        │•     •
    ──────•───────►
    均值 中位数 众数

对称分布:
      ▲
      │   •
      │  • •
      │ •   •
      │•     •
    ───•─•─•─────►
    众数 中 均

5. 性质与特点

  1. 无量纲:偏度是一个纯数,不受数据单位和尺度的影响
  2. 对称性基准:对称分布的偏度为0,但偏度为0不一定完全对称
  3. 异常值敏感:由于涉及三次方,对极端值比较敏感
  4. 应用广泛:在金融、气象、质量控制等领域有重要应用

6. 与其他矩的关系

偏度是概率分布三阶矩的标准化形式,与其他矩共同描述分布特征:

  • 一阶矩:均值 - 位置参数
  • 二阶矩:方差 - 尺度参数
  • 三阶矩:偏度 - 形状参数(不对称性)
  • 四阶矩:峰度 - 形状参数(尾部厚度)

7. 实际应用

7.1 金融领域

  • 资产收益率分布往往具有负偏度,意味着大幅下跌的概率大于大幅上涨

7.2 质量控制

  • 生产过程输出若出现偏度,可能预示某种系统性偏差

7.3 假设检验

  • 许多统计方法(如t检验、方差分析)假设数据近似正态分布
  • 检验偏度是验证正态性假设的重要步骤

8. 注意事项

  1. 小样本下偏度估计可能不准确
  2. 偏度只能描述不对称性,不能完全表征分布形状
  3. 在严重偏态的数据中,应考虑数据变换或使用非参数方法

总结:偏度是理解概率分布形态的重要工具,与均值和方差共同构成了描述随机变量分布特征的”三要素”。