假設$\mathbf{A}$是一個$3\times 3$矩陣(為了方便說明,以$3\times 3$為例,實際上任意的方陣皆可),$f(x)=a_0 + a_1x+\cdots+a_nx^n$是一個$n$階多項式。則矩陣函數$f(\mathbf{A}$定義為:
\[
f(\mathbf{A}) = a_0\mathbf{I} + a_1\mathbf{A}+\cdots+a_n\mathbf{A}^n
\]
簡而言之,就是將$x$以矩陣$\mathbf{A}$代換,注意此時常數項變成$a_0\mathbf{I}$,$\mathbf{I}$是單位矩陣。一般而言,直接將$\mathbf{A}$帶入計算,不是一個很好的方法,如果$\mathbf{A}$矩陣可以對角化,可以利用下述方法處理。若$\mathbf{A}$可對角化,則存在可逆矩陣$\mathbf{Q}$,使得$\mathbf{A}=\mathbf{QD}\mathbf{Q}^{-1}$,其中$\mathbf{D}$為對角矩陣
\[
\mathbf{D}=\left[\begin{array}{ccc} \lambda_1 & 0 & 0 \\ 0 & \lambda_2 & 0 \\ 0 & 0 & \lambda_3 \end{array}\right]
\]
$\lambda_1$、$\lambda_2$以及$\lambda_3$為$\mathbf{A}$的特徵值。將$\mathbf{A}$帶入$f(x)$之中,不難發現
\[
f(\mathbf{A}) = \mathbf{Q}f(\mathbf{D})\mathbf{Q}^{-1}. \hspace{2cm} (1)
\]
而由於$\mathbf{D}$為對角矩陣,經過計算可以發現
\[
f(\mathbf{D}) = \left[\begin{array}{ccc} f(\lambda_1) & 0 & 0 \\ 0 & f(\lambda_2) & 0 \\ 0 & 0 & f(\lambda_3) \end{array}\right].
\]
將上式帶回(1)式中,即可求得$f(\mathbf{A})$,計算已經大幅簡化。
若$f(x)$不為多項式,上述的方法不一定適用,而且除了幾個特殊的函數以外,通常不會成立。其中的一個特殊函數,而且在電機通訊領域常用的函數,也就是指數函數$f(x)=e^x$,也可以用上述的步驟來計算,而且在大學的線性代數,幾乎大概可能說不定或許絕對應該是多半或許考試一定會考。$e^x$在原點附近的泰勒展開式可以寫為
\[
e^x = \sum_{n=-\infty}^{\infty}\frac{x^n}{n!}
\]
可以想成是一個無窮多階的多項式。令$f(x)=e^x$帶入(1)式之後可得
\[
f(\mathbf{A}) = \mathbf{Q}f(\mathbf{D})\mathbf{Q}^{-1}
= \mathbf{Q}\sum_{n=-\infty}^{\infty}\frac{\mathbf{D}^n}{n!}\mathbf{Q}^{-1}
\]
同樣地,因為$\mathbf{D}$是對角矩陣,上式變成
\[
f(\mathbf{A}) = \mathbf{Q}\left[\begin{array}{ccc} e^{\lambda_1} & 0 & 0 \\ 0 & e^{\lambda_2} & 0 \\ 0 & 0 & e^{\lambda_3} \end{array}\right]\mathbf{Q}^{-1}.
\]
No comments:
Post a Comment