若尔当标准型#
我们对若尔当标准型的讨论始于两个最基本与最常见的问题:
- 如何将线性空间 \(V\) 分解为线性变换 \(A\) 的不变子空间 \(V_i\) 的直和?
- 如何使线性变换 \(A\) 在 \(V\) 的一组基上具有最简洁的矩阵形式?
对于问题一, 一个合理的附加条件是 \(A\) 在这些不变子空间 \(V_i\) 上具有良好的性质, 这样要研究 \(A\), 只需在每个更小的空间上研究, 并且充分利用那些性质, 最后汇总为 \(V\) 即可. 问题二则是为了方便计算, 我们可以利用这种简洁矩阵的性质, 提供远比普通矩阵乘法等更优的算法.
对于这两个问题, 我们首先想到的应该是线性变化的对角化. 对于可对角化的线性变换, 充要条件之一便是线性空间 \(V\) 可以被分解为特征子空间的直和 \(V = E(\lambda_1) \oplus E(\lambda_2) \oplus \cdots \oplus E(\lambda_n)\); 并且我们知道这一变换在其特征向量组成的基下是对角矩阵, 这样两个问题就都得到解决. 遗憾的是, 并非每一个矩阵都可以对角化. 我们要讨论的便是一种类似对角化的, 可以对每个变换进行的分解.
广义特征空间#
我们的讨论将限于复线性空间中, 即 \(\mathbb{C}\) 上的线性空间 \(V\).
某些线性变换没有足够的特征向量, 无法张成整个空间, 为了解决这个问题, 我们将要引入广义特征向量的概念.
对于线性变换 \(A\) 的特征值 \(\lambda\), 满足 \(\mathbf{v} \ne 0\) 且存在 \(j \in \mathbb{N}_+\) 使 \((A - \lambda I)^j \, \mathbf{v} = 0\), 则称 \(\mathbf{v}\) 是相应于 \(\lambda\) 的广义特征向量.