简介
矩阵指数将标量指数运算扩展到矩阵. 在矩阵李群的语境下, 指数映射由幂级数定义, 与矩阵指数一致, 矩阵指数就是李群的指数映射 (Exponential Map), 是李群与李代数之间的桥梁.
定义
给定一个矩阵 , 其矩阵指数 基于幂级数展开的定义:
其中 表示矩阵 的 次幂.
这个定义完全平行于实数指数函数, 因此称为”矩阵指数” .
李代数版本的描述
若 属于某个矩阵李代数 , 那么:
就是李群的指数映射. 例如:
- →
- →
几何意义
矩阵指数连接”无穷小变化” 和”有限变换” :
- 在李代数 中, 表示”速度” 或”生成元” ;
- 在李群 中, 表示”运动” 或”有限变换” .
直观地说:
**“求导操作在积分下变成指数操作” **
如果 是一个”角速度矩阵” , 那么 表示”旋转 秒后的姿态” .
在指数导数中:
正是此思想的最简单实例:
导数算符 (李代数元素) 通过指数映射生成平移 (李群元素) .
性质
- 幂级数收敛: 矩阵指数的级数在有限维矩阵上总是收敛.
- 与标量指数的关系: 如果 是对角矩阵, 其矩阵指数等于对角元素的标量指数.
- 乘积性质: 对于一般矩阵 , 仅有在 时, 才成立.
- 特殊情况:
- 当 为对称矩阵时, 是正定矩阵
- 当 为反对称矩阵时, 是正交矩阵.
推导
由于计算矩阵指数首先需要计算若干个的次幂, 很容易想到对进行对角化. 为了理解为什么对角化能够将指数运算放到矩阵的对角线中, 我们需要从矩阵指数的定义和对角化的性质开始.
一个矩阵 如果是可对角化的, 那么存在一个可逆矩阵 和一个对角矩阵 , 使得:
其中, 是一个对角矩阵, 其对角线元素是 的特征值.
通过对角化, 矩阵 的幂可以表示为:
其中有 个 .
矩阵乘法满足结合律, 因此可以先对部分括号内的矩阵相乘
由于 是单位矩阵, 因此:
因此, 矩阵 的指数可以表示为:
矩阵乘法满足结合律, 而求和运算本质上是多次加法, 因此 和 作为求和项的外部因子, 不会受到求和运算的影响, 可以将它们移到求和符号之外:
对角矩阵 的指数比较简单, 因为 的幂 也是一个对角矩阵, 其对角线元素是原对角线元素的幂:
因此,
即:
回到之前的矩阵指数表达式:
由于 是一个对角矩阵, 其对角线元素是 的特征值的指数, 因此 可以通过对角化后在对角线上进行指数运算, 再通过相似变换回到原矩阵的基底上.
总结
若 可对角化, 即 , 则
其中 ,
若 不可对角化, 可使用 Jordan 标准形或帕德近似求解.
这一形式说明: 矩阵指数将”线性组合的幂” 转化为”特征值的指数” , 是矩阵对角化思想的自然延伸.
计算
计算矩阵指数的常见方法有以下几种:
1. 幂级数展开 (Power Series Expansion)
矩阵指数 可以通过幂级数展开计算:
2. 对角化 (Diagonalization)
如果矩阵 是对角化的, 即 , 其中 是对角矩阵, 则:
其中 是对角矩阵, 其对角元素是 的对角元素的指数.
3. Jordan 标准形 (Jordan Canonical Form)
如果矩阵 不能对角化, 但可以转换为 Jordan 标准形 , 则:
其中 是 Jordan 标准形, 的计算稍微复杂, 但可以通过分块矩阵的方式计算.
4. 帕德近似 (Padé Approximation)
帕德近似是一种用有理函数逼近指数函数的方法, 可以在计算中取得很好的效果. 特别是在数值计算中, 帕德近似通常结合尺度和平方 (Scaling and Squaring) 方法来计算矩阵指数.
5. 数值算法
常用的数值算法包括 Scipy 和 Matlab 中提供的库函数. 例如在 Python 中, 可以使用 Scipy 库计算矩阵指数:
import numpy as np
from scipy.linalg import expm
A = np.array([[0, 1], [-1, 0]])
exp_A = expm(A)
print(exp_A)这种方法已经对于大型矩阵优化了计算过程.
示例
计算矩阵 的矩阵指数. 其中
- 幂级数展开
矩阵 的幂具有以下规律:
根据这一周期性, 矩阵指数的级数可以分为偶数项和奇数项:
- 偶数项 (标量乘 ) 为:
- 奇数项 (标量乘 ) 为:
因此:
- 对角化法
矩阵 的特征值为 , 可对角化(过程略):
矩阵指数为:
代入 , 结果与幂级数展开方法一致.
李群李代数方法
设二维旋转矩阵
则
这是旋转群 的一个元素, 说明 的指数映射确实落在 中.
应用
- 线性常微分方程的解: 对于形如 的线性常微分方程, 解可以写成 , 其中 是矩阵 的指数矩阵.
- 控制理论: 在离散时间控制系统中, 状态转移可以用指数矩阵表示: , 其中 是时间步长.
- 量子力学: 单位时间演化算符可以用哈密顿算符的指数矩阵表示:
- 图像处理: 在计算机视觉中, 指数矩阵用于图像滤波和变换, 如高斯卷积, 谱滤波.
- 刚体运动与机器人学: , 的姿态更新.
总结
矩阵指数既是线性代数的工具, 又是李群的”指数映射” :
| 层次 | 数学对象 | 作用 | 示例 |
|---|---|---|---|
| 线性代数 | 矩阵 | 将幂级数定义推广至矩阵 | |
| 李代数 | 无穷小生成元 | 局部结构 | 表示角速度或生成元 |
| 李群 | 光滑群 | 全局变换 | |
| 算符理论 | 导数算符 | 平移算符 |
因此, “矩阵指数” 是连接线性代数与微分几何的关键桥梁:
从局部导数出发, 经指数映射抵达全局变换.