若尔当标准型

若尔当标准型#

我们对若尔当标准型的讨论始于两个最基本与最常见的问题:

  • 如何将线性空间 \(V\) 分解为线性变换 \(A\) 的不变子空间 \(V_i\) 的直和?
  • 如何使线性变换 \(A\) 在 \(V\) 的一组基上具有最简洁的矩阵形式?

对于问题一, 一个合理的附加条件是 \(A\) 在这些不变子空间 \(V_i\) 上具有良好的性质, 这样要研究 \(A\), 只需在每个更小的空间上研究, 并且充分利用那些性质, 最后汇总为 \(V\) 即可. 问题二则是为了方便计算, 我们可以利用这种简洁矩阵的性质, 提供远比普通矩阵乘法等更优的算法.

对于这两个问题, 我们首先想到的应该是线性变化的对角化. 对于可对角化的线性变换, 充要条件之一便是线性空间 \(V\) 可以被分解为特征子空间的直和 \(V = E(\lambda_1) \oplus E(\lambda_2) \oplus \cdots \oplus E(\lambda_n)\); 并且我们知道这一变换在其特征向量组成的基下是对角矩阵, 这样两个问题就都得到解决. 遗憾的是, 并非每一个矩阵都可以对角化. 我们要讨论的便是一种类似对角化的, 可以对每个变换进行的分解.

广义特征空间#

我们的讨论将限于复线性空间中, 即 \(\mathbb{C}\) 上的线性空间 \(V\).

某些线性变换没有足够的特征向量, 无法张成整个空间, 为了解决这个问题, 我们将要引入广义特征向量的概念.

对于线性变换 \(A\) 的特征值 \(\lambda\), 满足 \(\mathbf{v} \ne 0\) 且存在 \(j \in \mathbb{N}_+\) 使 \((A - \lambda I)^j \, \mathbf{v} = 0\), 则称 \(\mathbf{v}\) 是相应于 \(\lambda\) 的广义特征向量.

可交换的线性变换

可交换的线性变换#

这篇文章讨论可交换的线性变换, 即对于线性变换 \(A\), \(B\), 有 \(AB = BA\).

引理#

对于多项式 \(f\), \(f(A)\) 与 \(B\) 可交换的充要条件是 \(A\), \(B\) 可交换.

充要条件#

复数域上线性变换 \(A\), \(B\) 可交换的充要条件是:

\(A\) 的每个广义特征空间 \(E_{\lambda}\) 都是 \(B\) 的不变子空间.

其中广义特征空间 \(E_{\lambda} = \{\mathbf{v} ~ | ~ (A - \lambda I)^m \; \mathbf{v} = \mathbf{0}, m \in \mathbb{N}_+\}\). 线性空间 \(V\) 总是可以分解为其上某一线性变换的广义特征空间的直和.

证明:
充分性: 任取 \(A\) 在重数 \(m\) 的广义特征空间 \(E_{\lambda}\), \(\forall \mathbf{v} \in E_{\lambda}; B \mathbf{v} \in E_{\lambda}\). 于是 \(B (A - \lambda I)^m \mathbf{v} = B \; \mathbf{0} = \mathbf{0}\), \((A - \lambda I)^m B \mathbf{v} = (A - \lambda I)^m (B \mathbf{v}) = \mathbf{0}\). 注意到 \((A - \lambda I)^m\) 是关于 \(A\) 的多项式, 由此可得 \(E_{\lambda}\) 上 \(A\) 与 \(B\) 可交换.