若爾當標準型

在線性代數中，若爾當標準型（英語：Jordan normal form）或若爾當正則式（英語：Jordan canonical form）是在有限維向量空間上的線性映射的一個特殊的矩陣表達形式，稱作若爾當矩陣（英語：Jordan matrix）。

這矩陣接近對角矩陣：除了主對角線和主對角線上方元素之外，其餘都是零，且主對角線上方的對角線的系數若不為零只能為 $1$ ，且這 $1$ 左方和下方的系數（都在主對角線上）有相同的值。譜定理和正規矩陣都是若爾當標準型的特殊情況，因為可以被對角化(diagonalizable)。若爾當矩陣理論說明了任何一個係數域為 $\mathbb {K}$ 的方塊矩陣 $M$ 如果特徵值都在 $\mathbb {K}$ 中，那麼必然和某個若爾當標準型相似。或者說，如果一個有限維向量空間上的自同態線性映射的特徵值都在係數域 $\mathbb {K}$ 中，那麼它可以在某個基底下表示成若爾當標準型。

若爾當標準型得名於十九世紀後期的法國數學家卡米爾·若爾當。

簡介

一個 $n\times n$ 的矩陣 $M$ 是可對角化的，若且唯若 $M$ 滿足下列條件之一：

$M$ 有n個線性無關的特徵向量。或者說， $M$ 有一個由特徵向量組成的基。（稱作極大無關條件）
$M$ 的所有特徵值的幾何重數（即相應特徵子空間的維數）等於相應的代數重數（即特徵多項式中 $(x-\lambda )$ 項的次數）。或者說， $M$ 的所有幾何重數之和等於n。（稱作重數相等條件）
$M$ 的極小多項式經標準分解後，每一項都是一次項，且重數都是1。（稱作互異單根條件）

矩陣的對角化使得研究其性質變為研究相應的對角矩陣的性質，而後者顯然簡單得多。由於不是所有矩陣都滿足上述三個條件之一，有的矩陣是不可對角化的，例如以下的：

M={\begin{bmatrix}5&4&2&1\\0&1&-1&-1\\-1&-1&3&0\\1&1&-1&2\end{bmatrix}}

計入重數的話， $M$ 的特徵值為1, 2, 4, 4。 $M-4I$ 的核的維數是1，因此 $M$ 不可對角化。但經過基底變換， $M$ 相似於下面的矩陣：

J={\begin{bmatrix}1&0&0&0\\0&2&0&0\\0&0&4&1\\0&0&0&4\end{bmatrix}}

矩陣 $J$ 近乎對角矩陣，除了第三列第四行係數是1。如果將後兩行和後兩列的部分作為一塊的話，矩陣 $J$ 就是一個分塊對角矩陣。若爾當標準型的目標就是將更多的矩陣化簡到一類只比對角矩陣稍微複雜的矩陣：若爾當標準型。實際上這是一種簡單的分塊對角矩陣。

J={\begin{bmatrix}J_{1}&\;&\;\\\;&\ddots &\;\\\;&\;&J_{p}\end{bmatrix}}

這裏的「簡單」是指每小塊矩陣都具備一種很簡單的形狀：

J_{i}={\begin{bmatrix}\lambda _{i}&1&\;&\;\\\;&\lambda _{i}&\ddots &\;\\\;&\;&\ddots &1\\\;&\;&\;&\lambda _{i}\end{bmatrix}}

其中主對角線上都是同一個係數，而對角線上方一排全是1。形同以上 $J_{i}$ 的矩陣稱為若爾當矩陣。而矩陣 $J$ 中每一個這樣的小塊被稱為若爾當塊。

線性代數中有如下的結果：

對任意係數域為 $\mathbb {K}$ 的矩陣 $M$ ，只要其特徵值都在 $\mathbb {K}$ 中，就存在一個與之相似的若爾當標準型 $J$ ： $M=PJP^{-1}$ ，其中 $P$ 是一個可逆矩陣。並且滿足：

矩陣 $J$ 的特徵值（計入重數）就是主對角線上的係數。
對於 $J$ 的一個特徵值 $\lambda _{i}$ ，它的幾何重數就是屬於特徵值 $\lambda _{i}$ 的若爾當塊的個數。
所有屬於特徵值 $\lambda _{i}$ 的若爾當塊的維數之和是特徵值 $\lambda _{i}$ 的代數重數。

證明

廣義特徵向量

考慮前面例子中的矩陣M。M的若爾當標準型可以寫成P⁻¹MP = J，即

\;MP=PJ

其中變換矩陣P的四個列向量為：p_i , i = 1, ..., 4，於是

M{\begin{bmatrix}p_{1}&p_{2}&p_{3}&p_{4}\end{bmatrix}}={\begin{bmatrix}p_{1}&p_{2}&p_{3}&p_{4}\end{bmatrix}}{\begin{bmatrix}1&0&0&0\\0&2&0&0\\0&0&4&1\\0&0&0&4\end{bmatrix}}={\begin{bmatrix}p_{1}&2p_{2}&4p_{3}&p_{3}+4p_{4}\end{bmatrix}}

也就是：

\;(M-1I)p_{1}=0,\;\,(M-2I)p_{2}=0

\;(M-4I)p_{3}=0,\;\,(M-4I)p_{4}=p_{3}

對於i = 1、2、3， $p_{i}$ 都是某個特徵值所對應的特徵向量： $p_{i}\in \operatorname {Ker} (M-\lambda I)$ 。然而，當i=4時, $p_{4}$ 並不是特徵值4所對應的特徵向量。儘管如此：

\;(M-4I)^{2}p_{4}=(M-4I)p_{3}=0

於是 $p_{4}\in \operatorname {Ker} (M-\lambda I)^{2}$ 。像 $p_{4}$ 這樣的向量被稱為M的廣義特徵向量。

給定一個特徵值 $\scriptstyle \lambda$ ，它對應的若爾當塊 $\displaystyle J_{\lambda ,m}$ ：

{\begin{bmatrix}\lambda &1&0&\cdots &0\\0&\lambda &1&\cdots &0\\\vdots &\vdots &\ddots &\vdots &\vdots \\0&0&0&\lambda &1\\0&0&0&0&\lambda \\\end{bmatrix}}

對應着一個由廣義特徵向量所張成的子空間，因為對應的基底 $\displaystyle e_{\lambda ,1},e_{\lambda ,2},\cdots ,e_{\lambda ,m}$ 滿足：

\;(M-\lambda I)e_{\lambda ,1}=0,\;(M-\lambda I)e_{\lambda ,2}=e_{\lambda ,1},\cdots ,(M-\lambda I)e_{\lambda ,m}=e_{\lambda ,m-1}

也就是說

\;(M-\lambda I)e_{\lambda ,1}=0,\;(M-\lambda I)^{2}e_{\lambda ,2}=0,\cdots ,(M-\lambda I)^{m}e_{\lambda ,m}=0

因此，「所有特徵值在 $\mathbb {K}$ 中的矩陣都相似於某個若爾當標準型」這個命題等價於存在一個由這個矩陣的特徵向量和廣義特徵向量構成的全空間的基底。

冪零矩陣的情況

當矩陣A為冪零矩陣（即存在m使得 $A^{m}=0$ ）時，可以證明整個空間總是可以分解為若干個A-循環子空間的直和^[1]。所謂的A-循環子空間就是由某個向量v以及基底： ${\mathit {B}}_{v}=\left\{v,Av,A^{2}v,\cdots \right\}$ 線性張成的子空間。顯然，這樣的子空間是A-不變子空間。同時，注意到 ${\mathit {B}}_{v}$ 是由A的特徵向量和廣義特徵向量構成的（ $\forall j\geq 0,A^{j}v\in \operatorname {Ker} A^{m}$ ）。因此在這個循環子空間裏，A在基底 $\displaystyle {\mathit {B}}_{v}$ 下表示為若爾當塊：

J_{v}={\begin{bmatrix}0&1&0&\cdots &0\\0&0&1&\cdots &0\\\vdots &\vdots &\ddots &\vdots &\vdots \\0&0&0&0&1\\0&0&0&0&0\\\end{bmatrix}}

因此A在所有這樣的基底下可以表示為由若爾當塊組成的分塊對角矩陣，即若爾當標準型：

J={\begin{bmatrix}J_{v_{1}}&0&0&\cdots &0\\0&J_{v_{2}}&0&\cdots &0\\\vdots &\vdots &\ddots &\vdots &\vdots \\0&0&0&J_{v_{s-1}}&0\\0&0&0&0&J_{v_{s}}\\\end{bmatrix}}

一般情況

下面用數學歸納法證明：所有特徵值在 $\mathbb {K}$ 中的n × n的矩陣都相似於某個若爾當標準型。

n= 1的情況顯然。對於 $n>1$ 考慮n × n矩陣A。對於A的一個特徵值λ，設s為λ的幾何重數。設線性變換 $(A-\lambda I)^{s}$ 的像空間為 $\mathrm {Im} (A-\lambda I)^{s}$ ，這是關於A的一個不變子空間。因為λ是特徵值， $\mathrm {Im} (A-\lambda I)^{s}$ 的空間維數r嚴格小於n。記 $\scriptstyle A^{\prime }$ 為A在子空間限制 $\mathrm {Im} (A-\lambda I)^{s}$ 上的部分。根據歸納假設存在一個基底：{p₁, ..., p_r}使得 $\scriptstyle A^{\prime }$ 在這個基底上為若爾當標準型。

接下來考慮子空間 $\operatorname {Ker} (A-\lambda I)^{s}$ ，只要能夠證明整個空間可以分為：

C^{n}=\mathrm {Im} (A-\lambda I)^{s}\oplus \mathrm {Ker} (A-\lambda I)^{s}

由於 $\mathrm {Ker} (A-\lambda I)^{s}$ 是一個A-不變子空間，在上面 $A-\lambda I$ 是冪零矩陣，因此可以寫成若爾當標準型：

J={\begin{bmatrix}J_{v_{1}}&0&0&\cdots &0\\0&J_{v_{2}}&0&\cdots &0\\\vdots &\vdots &\ddots &\vdots &\vdots \\0&0&0&0&J_{v_{s}}\\\end{bmatrix}}

而加上 $\displaystyle \lambda I$ 後還是若爾當標準型。因此，A在 $\mathrm {Ker} (A-\lambda I)^{s}$ 和 $\mathrm {Im} (A-\lambda I)^{s}$ 上都能寫成若爾當標準型，從而A相似於某個若爾當標準型。

利用歸納法可知所有的n × n的矩陣都相似於某個若爾當標準型。

下面證明：

C^{n}=\mathrm {Im} (A-\lambda I)^{s}\oplus \mathrm {Ker} (A-\lambda I)^{s}

設A的最小多項式為 $\pi _{A}$ ，並將其寫成 $\pi _{A}=(X-\lambda I)^{s}\cdot Q$ 。於是 $Q$ 和 $(X-\lambda I)^{s}$ 互素。於是根據裴蜀定理，存在多項式：a和b使得 $a(X-\lambda I)^{s}+bQ=1$ 。每個向量u都可以寫成：

\displaystyle u=a(A-\lambda I)^{s}(u)+bQ(A)(u)

並且 $\displaystyle Q(A)(a(A-\lambda I)^{s}(u))=(Q(A-\lambda I)^{s})(a(u))=\pi _{A}(u)=0$ ，同樣地 $\displaystyle (A-\lambda I)^{s}(bQ(A)(u))=((A-\lambda I)^{s}Q)(b(u))=\pi _{A}(u)=0$ ，因此 $a(A-\lambda I)^{s}(u)\in \mathrm {Ker} (Q(A)),\;bQ(A)(u)\in \mathrm {Ker} (A-\lambda I)^{s}$ ，也就是說：

\displaystyle C^{n}=\mathrm {Ker} (Q(A))+\mathrm {Ker} (A-\lambda I)^{s}

另一方面，任意 $v\in \mathrm {Ker} (A-\lambda I)^{s}\cap \mathrm {Ker} (Q(A))$ ， $\displaystyle v=a(A-\lambda I)^{s}(v)+bQ(A)(v)=0+0=0$ 。也就是說： $\mathrm {Ker} (A-\lambda I)^{s}\cap \mathrm {Ker} (Q(A))={0}$ 。綜上所述，

C^{n}=\mathrm {Ker} (Q(A))\oplus \mathrm {Ker} (A-\lambda I)^{s}

然而 $\forall u\in \mathrm {Im} (A-\lambda I)^{s}$ ， $\displaystyle Q(A)(u)=0$ ，從而 $\mathrm {Im} (A-\lambda I)^{s}\subset \mathrm {Ker} (Q(A))$ 。而根據秩-零化度定理， $\mathrm {Ker} (Q(A))$ 和 $\mathrm {Im} (A-\lambda I)^{s}$ 維數相等，所以兩者完全相等。於是

C^{n}=\mathrm {Im} (A-\lambda I)^{s}\oplus \mathrm {Ker} (A-\lambda I)^{s}

從而命題得證。

推論

如果矩陣的係數域是一個代數閉域，那麼由於其特徵值是特徵多項式的根，所以也在係數域中。於是只要係數域是一個代數閉域，所有的矩陣都相似於若爾當標準型。特別的，所有復係數矩陣都可以簡化為若爾當標準型，因為複數域是代數封閉的。
所有的若爾當標準型都可以分解成一個對角矩陣D和一個只有對角線上一排為1的矩陣N的和。注意，這兩個矩陣是不可交換的，因為對角矩陣D不一定是數量矩陣。矩陣N是一個冪零矩陣。因此，每個相似於若爾當標準型的矩陣都可以寫成可交換的一個對角矩陣和一個冪零矩陣的和。因為與對角矩陣和冪零矩陣相似的矩陣仍然是對角矩陣和冪零矩陣。換句話說，只要一個矩陣的特徵值都在它的係數域裏（或者說它的最小多項式或特徵多項式可以分解成一次項的乘積），就可以將這個矩陣分解成一個對角矩陣和一個冪零矩陣的和，但要注意這兩個矩陣可以交換。當對角矩陣為數量矩陣時，在計算矩陣的指數時是很方便的（可以用二項式展開）。

譜映射定理

用若爾當標準型以及直接的計算可以得出：如果n × n矩陣A的特徵值為：λ₁, ..., λ_n，那麼對於多項式：p，矩陣p(A)的特徵值是：p(λ₁), ..., p(λ_n)。

凱萊-哈密爾頓定理

凱萊-哈密爾頓定理斷言任意矩陣A都是特徵方程的根：如果p是A的特徵多項式，那麼p(A) = 0。這個定理一樣可以用若爾當標準型直接計算得出。

最小多項式

方塊矩陣A的最小多項式是使得m(A) = 0的非常數首一多項式中次數最小者。另一種定義是：所有使得m(A) = 0的多項式構成主理想環C[x]的一個理想I，而m則是這個理想的產生子。

對於有若爾當標準型的矩陣A，其最小多項式以其特徵值為根，並且由若爾當標準型的形狀可以看出，每個特徵值的重數是若爾當標準型中屬於這個特徵值的最大的若爾當塊的維數。

反之已知矩陣A的最小多項式並不能知道其若爾當標準型。要確定矩陣A的標準型需要用到所謂的初等因子。矩陣A的一個初等因子是它的某一個若爾當塊的特徵多項式（或最小多項式，對於若爾當塊兩者一樣）。如果所有的初等因子都是一次多項式，那麼A可對角化。

不變子空間分解

一個n × n的矩陣A的若爾當標準型是分塊對角矩陣，因此給出了一個將n維歐幾里得空間分解為矩陣A的不變子空間的具體方法。每個若爾當塊J_i都對應着一個不變子空間：X_i。可以簡記為：

\mathbb {C} ^{n}=\bigoplus _{i=1}^{k}X_{i}

其中的每個X_i都是由若爾當塊J_i對應的廣義特徵向量張成的子空間。

注意到這裏的k並不是不同的特徵值的個數，因為屬於同一個特徵值的若爾當塊可以不止一個。如果要將 $\mathbb {C} ^{n}$ 分解為l個不變子空間，其中l是不同特徵值的個數的話，可以將屬於同一個特徵值，比如說 $\scriptstyle \lambda _{i}$ 的若爾當塊合併：只需使用A的最小多項式 $\pi _{A}$ 中關於 $\scriptstyle \lambda _{i}$ 的重根數（代數重數） $\scriptstyle \nu (\lambda _{i})$ ，考慮空間：

\;Y_{i}=\operatorname {Ker} (\lambda _{i}I-A)^{\nu (\lambda _{i})}.

這就是所有的屬於同一個特徵值 $\scriptstyle \lambda _{i}$ 的若爾當塊所對應的X_i,p所合併後的空間，因為它包含了所有使得經過 $\scriptstyle \nu (\lambda _{i})$ 次 $\scriptstyle \lambda _{i}I-A$ 操作後會清零的向量集合。如果某個X_i中向量沒有被清零，那麼由於這個向量也不會被其他的特徵值 $\scriptstyle \lambda _{j}I-A$ 清零，它將不會被 $\scriptstyle \pi _{A}$ 清零，這與 $\pi _{A}(A)=0$ 矛盾。

於是n維歐幾里得空間也可以被分解為

\mathbb {C} ^{n}=\bigoplus _{i=1}^{l}Y_{i}

其中l是矩陣A的不同的特徵值的個數。

值得注意的是，這裏的指標ν(λ)是使得特徵零空間 $\operatorname {Ker} (\lambda I-A)^{m}$ 「穩定」下來的最小次數：

\mathrm {Ker} (\lambda I-A)^{\nu (\lambda )}=\operatorname {Ker} (\lambda I-A)^{m},\;\forall m\geq \nu (\lambda )

這也可以作為代數重數的另一個定義。

參見

註釋

^ （英文）J.H. Shapiro的一個證明（頁面存檔備份，存於互聯網檔案館）

參考來源

N.丹佛，J.T.施瓦茨，《線性算子》第一章：一般理論（Linear Operators, Part I: General Theory）, Interscience, 1958.
Daniel.T. Finkbeiner II,《矩陣與線性變換導論》第三版（Introduction to Matrices and Linear Transformations, Third Edition）, Freeman, 1978.
Gene H. Golub，Charles F. van Loan,《矩陣計算》第三版（Matrix Computations）, Johns Hopkins University Press, Baltimore, 1996.
Gene H. Golub，J. H. Wilkinson,《病態特徵系統以及若爾當標準型計算》（Ill-conditiones Eigensystems and the computation of the Jordan normal form）, SIAM Review, vol. 18, nr. 4, pp. 578–619, 1976.
Horn, Roger A.; Johnson, Charles R., 矩阵分析（Matrix Analysis）, Cambridge University Press, 1985, ISBN 978-0-521-38632-6 .
Glenn James，Robert C. James,《數學辭典》第四版（Mathematics Dictionary, Fourth Edition）, Van Nostrand Reinhold, 1976.
Saunders MacLane，Garrett Birkhoff,《代數學》（Algebra）, MacMillan, 1967.
Anthony N. Michel，Charles J. Herget,《應用代數和泛函分析》（Applied Algebra and Functional Analysis）, Dover, 1993.
Georgi E. Shilov,《線性代數》（Linear Algebra）, Dover, 1977.
若爾當正規型（頁面存檔備份，存於互聯網檔案館）

外部連結

[1] （英文）J.H. Shapiro的一個證明（頁面存檔備份，存於互聯網檔案館）

[1]