$\def\Ker{\opcol{\rm Ker}\,}\def\Kerkakko#1{\opcol{\rm Ker}\haiiro{\left(\kuro{#1}\right)}}\def\Img{\opcol{\rm Im}\,}\def\tr{\opcol{\rm tr}\,}\def\Imgkakko#1{\opcol{\rm Im}\haiiro{\left(\kuro{#1}\right)}}\def\fromR{{\scriptscriptstyle\langle}}\def\fromL{{\scriptscriptstyle\rangle}}$ $\newcommand{\mtx}[2][cc]{\opcol{\left({\color{black}\begin{array}{@{\,}#1@{\,}}#2\end{array}}\right)}}$ $\definecolor{thetacolor}{RGB}{230,0,39}\def\thetacol#1{{\color{thetacolor}#1}}$ $\def\rank{\opcol{\rm rank}\,}$ $\def\kakko#1{\haiiro{\left(\kuro{#1}\right)}}\def\Kakko#1{\haiiro{\left[\kuro{#1}\right]}}\def\coldx{{\color{xcolor}\mathrm dx}}$ $\definecolor{ycolor}{RGB}{217,61,137}\def\ycol#1{{\color{ycolor}#1}}\def\haiiro#1{{\color{hai}#1}}\def\kuro#1{{\color{kuro}#1}}$ $\def\coldr{\rcol{\mathrm dr}}\def\coldvecx{\xcol{\mathrm d\vec x}}\def\intdx{\opcol{\int \mathrm dx}}\def\E{\mathrm e}\def\I{\mathrm i}\definecolor{opcol}{RGB}{149,139,0}\definecolor{hai}{RGB}{137,137,137}\definecolor{tcol}{RGB}{166,54,109}\definecolor{kuro}{RGB}{0,0,0}\definecolor{xcolor}{RGB}{169,103,49}$ $\def\opcol#1{{\color{opcol}#1}}\def\ddx{\opcol{{\mathrm d\over \mathrm dx}}}\def\ddt{\opcol{{\mathrm d\over \mathrm dt}}}\def\scol#1{\color{scolor}#1}$ $\def\ve{\vec{\mathbf e}}\def\colvecx{\xcol{\vec x}}\definecolor{usuopcolor}{RGB}{237,234,203}$ $\def\xcol#1{{\color{xcolor}#1}}$ $\def\gunderbrace{\underbrace}$ $\def\ovalbox{\boxed}\def\kesi#1{\underbrace{#1}_{0}}\newcommand\dum[2][xcolor]{{\color{#1}{\scriptstyle #2}}}\newcommand\dml[2][xcolor]{\,\haiiro{\!\lceil}{\!\color{#1}#2}}\newcommand\dmr[2][xcolor]{{\color{#1}#2}\!\haiiro{\rfloor}\!}}$ $\def\usuopcol#1{\color{usuopcolor}#1}\def\vgrad#1{{\usuopcol{\overrightarrow{\opcol{\rm grad}~\kuro{#1}}}}}\def\dX{\rcol{\mathrm dX}}\def\dY{\thetacol{\mathrm dY}}\def\opdf{\opcol{\mathrm df}}\def\coldf{\tcol{\mathrm df}}\def\dtwof{\opcol{\mathrm d^2f}}\def\murasakidb{\zcol{\mathrm d b}}\def\ao{\ycol}\def\aodV{\ycol{\diff V}}\def\aka{\xcol}\def\akadm{\xcol{\diff m}}$ $\def\psicol#1{{\color{psicolor}#1}}$ $\def\ope#1{\opcol{\hat{#1}}}$ $\def\diff{\mathrm d}\def\kidb{\opcol{\mathrm db}}\def\kidx{\opcol{\mathrm dx}}\def\coldy{\ycol{\mathrm dy}}$ $\def\Odr{{\cal O}}\definecolor{ncol}{RGB}{217,51,43}\def\ncol#1{{\color{ncol}#1}}\definecolor{zcolor}{RGB}{196,77,132}\def\zcol#1{{\color{zcolor}#1}}$ $\def\coldtheta{\thetacol{\mathrm d\theta}}\def\ddtheta{\opcol{{\mathrm d\over\mathrm d\theta}}}\def\tcol#1{{\color{tcol}#1}}\def\coldt{\tcol{\mathrm dt}}\def\kidtheta{\opcol{\mathrm d\theta}}\def\dtwodx{\opcol{\diff^2\over\diff x^2}}\def\kokode#1{~~~~~~~{↓#1}}\def\goverbrace{\overbrace}\def\coldz{\zcol{\mathrm dz}}\def\kidt{\opcol{\mathrm dt}}\definecolor{rcol}{RGB}{206,114,108}\def\rcol#1{{\color{rcol}#1}}\def\coldtwox{\xcol{\mathrm d^2x}}\def\PDC#1#2#3{{\opcol{\left(\opcol{{\partial \kuro{#1}\over \partial #2}}\right)}}_{#3}}\def\PDIC#1#2#3{{\opcol{\left(\opcol{\partial \over \partial #2}\kuro{#1}\right)}}_{#3}}\def\PD#1#2{{{\partial \kuro{#1}\over \partial #2}}}\def\PPDC#1#2#3{{\opcol{\left(\opcol{\partial^2 \kuro{#1}\over \partial #2^2}\right)}}_{#3}}\def\PPDD#1#2#3{{\opcol{{\partial^2 \kuro{#1}\over \partial #2\partial #3}}}}\def\PPD#1#2{{\opcol{{\partial^2 \kuro{#1}\over \partial #2^2}}}}\def\kidy{\opcol{\diff y}}$ $\def\tatevec#1{\boxed{#1}}\def\allc#1{\haiiro{\{}#1\haiiro{\}}}$ $\def\nagatatevec#1{\tatevec{\begin{array}{c}\\#1\\ \\\end{array}}}$ $\def\yokovec#1{\boxed{~~\left(#1\right)^t~~}}$ $\def\yokovectnashi#1{\boxed{#1}}$ $\def\nagayokovec#1{\boxed{~~~~~\left(#1\right)^t~~~~~}}$ $\def\sM{M}\def\sN{N}\definecolor{mxcolor}{RGB}{102,41,71}\def\mxcol#1{{\color{mxcolor}#1}}\newcommand{\mt}[1]{\mxcol{\bf #1}}\newcommand{\rv}[1]{\opcol{\left({\color{black}\begin{array}{@{\,}c@{\,}}#1\end{array}}\right)}}$ $\definecolor{phicolor}{RGB}{153,61,23}\definecolor{psicolor}{RGB}{229,69,115}$ $\def\phicol#1{{\color{phicolor}#1}}$ $\definecolor{rcolor}{RGB}{204,82,122}\definecolor{thetacolor}{RGB}{255,0,38}\definecolor{scolor}{RGB}{178,107,107}$ $\def\avec#1{\xcol{\mathbf #1}}$

「物理数学Ⅰ」2021年度講義録第13回

前回の感想・コメントシートから

 前回の授業の「感想・コメント」の欄に書かれたことと、それに対する返答は、

にありますので見ておいてください。

ビデオ↓
以下は文章による説明。

Cayley-Hamiltonの定理と行列の対角化

特性多項式とCayley-Hamiltonの定理

 特性方程式 $$ (\xcol{x}-\lambda_1)(\xcol{x}-\lambda_2)\cdots(\xcol{x}-\lambda_\sN)=0 $$ の左辺の$\lambda$を行列$\mt{M}$に、$-\lambda_i$という数をその後ろに単位行列を掛けた行列$-\lambda_i\mt{I}$に置き換えて、 \begin{align} (\mt{M}-\lambda_1\mt{I}) (\mt{M}-\lambda_2\mt{I}) \cdots (\mt{M}-\lambda_\sN\mt{I}) \end{align} という式を作る。

 あたかも$\lambda\to\mt{M}$という「代入」を行っているような式だが、数に行列を代入するというのは厳密に考えると変なので、あくまで「置き換え」である。

 これが実は零行列$\mt{0}$であることを示す定理がある。

Cayley-Hamiltonの定理

 行列$\mt{M}$の特性多項式$\phi_{\mt{M}}\kakko{\xcol{x}}$の$\xcol{x}$を行列$\mt{M}$に置き換えて作った行列は零行列である。 \begin{align} \phi_{\mt{M}}\kakko{\mt{M}}=\mt{0} \end{align}

 証明を以下で示す(証明は何種類もある)。

FAQ:$\det\kakko{\mt{M}-\xcol{x}\mt{I}}$の$\xcol{x}\mt{I}$に$\mt{M}$を代入すれば、$\det\kakko{\mt{M}-\mt{M}}$になるから、証明は簡単ですね?

 いや、そんな計算は無茶である。2×2行列の場合で書くと、 \begin{align} \det\kakko{\mt{M}-\xcol{x}\mt{I}}=\det\kakko{\mtx{a&b\\c&d}-\mtx{\xcol{x}&0\\0&\xcol{x}}} \end{align} なのだ。これを \begin{align} \det\kakko{\mt{M}-\xcol{x}\mt{I}}=(a-\xcol{x})(d-\xcol{x})-bc \end{align} と展開した後で$\xcol{x}$を$\mt{M}$に(と同時に定数を$\mt{I}$の定数倍に)置き換えた、 \begin{align} \left(a\mt{I}-\mt{M})\right)\left(d\mt{I}-\mt{M}\right)-bc\mt{I} \end{align} としたものが0になる、というのはCayley-Hamiltonの定理であり、これは$\det\kakko{\mt{M}-\mt{M}}$とは全く違う。

 ちなみにこの行列は、 \begin{align} & \mtx{0&-b\\ -c&a-d}\mtx{d-a&-b\\ -c&0}-\mtx{bc&0\\ 0&bc}\nonumber\\ =&\mtx{bc&0\\ c(a-a)+(a-d)c&bc}-\mtx{bc&0\\ 0&bc}=\mtx{0&0\\0&0} \end{align} となって確かに$\mt{0}$である。

固有値がすべて異なる場合のCayley-Hamiltonの定理の証明

固有値がすべて異なる場合のCayley-Hamiltonの定理の証明

 以下の話の説明ビデオは↓

 Cayley-Hamiltonの定理は、$N\times N$行列の固有値$N$個がすべて異なるときは以下のように簡単に証明できる。

 $N$個の固有値$\allc{\lambda_*}$のそれぞれについて$\det{\mt{M}-\lambda_i\mt{I}}=0$が成り立つから、それぞれに1本ずつ右固有ベクトル$\vec v_{\fromL\lambda_i}$を見つけることができる。

今は$N$次元空間を考えているので固有ベクトルの本数が$N$を超えることはない。ゆえに同じ固有値の固有ベクトルが2本以上存在することはない。

 行列$\phi_{\mt{M}}$を$\mt{M}$の固有ベクトルの一つに掛けると、 \begin{align} & (\mt{M}-\lambda_1\mt{I}) (\mt{M}-\lambda_2\mt{I}) \cdots \gunderbrace{ (\mt{M}-\lambda_i\mt{I})}_{右へ移動→} \cdots (\mt{M}-\lambda_\sN\mt{I})\vec v_{\fromL \lambda_i}\nonumber\\ =& (\mt{M}-\lambda_1\mt{I}) (\mt{M}-\lambda_2\mt{I}) \cdots \cdots (\mt{M}-\lambda_\sN\mt{I})\gunderbrace{(\mt{M}-\lambda_i\mt{I})}_{移動してきた} \vec v_{\fromL\lambda_i}=\vec 0 \end{align} となって($\mt{M}-\lambda_i\mt{I}$と$\mt{M}-\lambda_j\mt{I}$は交換可能なことに注意)零ベクトルとなる。

 今固有ベクトルが$N$本(次元の数と同じ数)ある場合を考えている。これらの固有ベクトルは独立である。よって、$N$次元の任意のベクトル$\vec V$を \begin{align} \vec V=\sum_{\dum{i}=1}^N \alpha_{\dml{i}} \vec v_{\fromL\lambda_{\dmr{i}}} \end{align} と表現することができる(この固有ベクトルは左固有ベクトルでも右固有ベクトルでもいい)。この任意のベクトルに$\phi_{\mt{M}}\kakko{\mt{M}}$を掛けると、(各々の$\vec v_i$に掛かった結果が$\vec 0$なので)零ベクトルになる。任意のベクトルに掛けて零ベクトルになるということは、この行列自体が零行列である。すなわち、 \begin{align} (\mt{M}-\lambda_1\mt{I}) (\mt{M}-\lambda_2\mt{I}) \cdots (\mt{M}-\lambda_\sN\mt{I})=\mt{0} \end{align} がわかる。

 以上のことは、「ベクトル空間の分解」としてとらえることもできる。

固有値によるベクトル空間の分解(固有値がすべて異なる場合)

 $N\times N$行列$\mt{M}$の固有値がすべて異なる$N$個存在するとき、ベクトル空間は \begin{align} V=\Kerkakko{\mt{M}-\lambda_1\mt{I}}\oplus \Kerkakko{\mt{M}-\lambda_2\mt{I}}\oplus\cdots\oplus\Kerkakko{\mt{M}-\lambda_\sN\mt{I}}\label{koyuuchibunkai} \end{align} のように直和分解される。

 任意の$i,j$に対して$\mt{M}-\lambda_i\mt{I}$と$\mt{M}-\lambda_j\mt{I}$が交換することと、$\Kerkakko{\mt{M}-\lambda_i\mt{I}}$と$\Kerkakko{\mt{M}-\lambda_j\mt{I}}$の共通部分が$\vec{0}$しかないことからわかる。

 $\lambda_1\neq\lambda_2$のときに

  • $(\mt{M}-\lambda_1\mt{I})\vec v=\vec 0$
  • $(\mt{M}-\lambda_2\mt{I})\vec v=\vec 0$

が同時に成り立てば、辺々引くことで$(\lambda_1-\lambda_2)\vec v=0$になってしまうから$\vec v$は零ベクトルとなってしまう。

 $(\mt{M}-\lambda_1\mt{I})(\mt{M}-\lambda_2\mt{I})\cdots (\mt{M}-\lambda_\sN\mt{I})$という行列が掛かると、この空間が右にあるものから順に消されていき、最後の$\mt{M}-\lambda_1\mt{I}$が掛かると全ベクトルがいなくなる。任意のベクトルに掛けて0になる行列は零行列である。

前回の感想・コメントシートから 固有値がすべて異なる場合の対角化

固有値がすべて異なる場合の対角化

 以下の話の説明ビデオは↓
 固有値がすべて異なる場合に固有ベクトルを$N$本持ってくることができたとして、$\mt{M}\vec v_{\fromL\lambda_i}=\lambda_i\vec v_{\fromL\lambda_i}$を満たす右固有ベクトルと$(\vec v^{\lambda_i\fromR})^5\mt{M}=\lambda_i(\vec v^{\lambda_i\fromR})^t$を満たす左固有ベクトルを \begin{align} \mt{P}=\mtx[c@{\,}c@{}c@{}c]{ \nagatatevec{\vec v_{\fromL\lambda_1}}& \nagatatevec{\vec v_{\fromL\lambda_2}}& \cdots& \nagatatevec{\vec v_{\fromL\lambda_\sN}} },~~~{\mt{P^{-1}}}= \mtx[c]{ \nagayokovec{\vec v^{\lambda_1\fromR}}\\ \nagayokovec{\vec v^{\lambda_2\fromR}}\\ \vdots\\ \nagayokovec{\vec v^{\lambda_\sN\fromR}} } \end{align} のように並べた行列$\mt{P},\mt{P^{-1}}$を作る($\mt{P^t}$や$\mt{P^\dagger}$が$\mt{P^{-1}}$になるとは限らないので注意)。ここで、左固有ベクトルと右固有ベクトルを、$\vec v_{\lambda_i\fromR}\cdot \vec v_{\fromL\lambda_j}=\delta^i_{~j}$を満たすように規格化しておけば、上の$\mt{P^{-1}}$は確かに$\mt{P}$の逆行列となる。
$\lambda_i$と$\lambda_j$が違う場合は$\vec v_{\lambda_i\fromR}\cdot \vec v_{\fromL\lambda_j}=0$なのはすでにz前回示しているから、同じものどうしで1になるようにベクトルをスカラー倍すればOK。

 これらを使って$\mt{M}$を相似変換した$\mt{M'}=\mt{P^{-1}MP}$を計算すると、 \begin{align} &\goverbrace{\mtx[c]{ \nagayokovec{\vec v_{\lambda_1\fromR}}\\ \nagayokovec{\vec v_{\lambda_2\fromR}}\\ \vdots\\ \nagayokovec{\vec v_{\lambda_\sN\fromR}} }}^{\mt{P^{-1}}} \goverbrace{\mtx[c@{\,}c@{}c@{}c]{ \nagatatevec{\mt{M}\vec v_{\fromL\lambda_1}}& \nagatatevec{\mt{M}\vec v_{\fromL\lambda_2}}& \cdots& \nagatatevec{\mt{M}\vec v_{\fromL\lambda_\sN}} }}^{\mt{M}\mt{P}} \nonumber\\ =&\mtx[c]{ \nagayokovec{\vec v_{\lambda_1\fromR}}\\ \nagayokovec{\vec v_{\lambda_2\fromR}}\\ \vdots\\ \nagayokovec{\vec v_{\lambda_\sN\fromR}}} \mtx[c@{\,}c@{}c@{}c]{ \nagatatevec{\lambda_1\vec v_{\fromL\lambda_1}}& \nagatatevec{\lambda_2\vec v_{\fromL\lambda_2}}& \cdots& \nagatatevec{\lambda_\sN\vec v_{\fromL\lambda_\sN}} } =\mtx[c@{\,}c@{}c@{}c]{\lambda_1&0&\cdots&0\\ 0&\lambda_2&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\lambda_\sN } \end{align} のように、結果は対角行列となる。このことから、「(固有値がすべて異なる場合について)行列式の値は固有値の積$\det\mt{M}=\prod_{\dum{i}=1}^N \lambda_{\dum{i}}$」だとわかる。

 この相似変換された$\mt{M'}$は明らかに、 \begin{align} \goverbrace{\mtx[c@{\,}c@{}c@{}c]{0&0&\cdots&0\\ 0&\lambda_2-\lambda_1&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\lambda_\sN-\lambda_1 }}^{\mt{M'}-\lambda_1} \goverbrace{\mtx[c@{\,}c@{}c@{}c]{\lambda_1-\lambda_2&0&\cdots&0\\ 0&0&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&\lambda_\sN-\lambda_2 } }^{\mt{M'}-\lambda_2}\cdots \goverbrace{\mtx[c@{\,}c@{}c@{}c]{\lambda_1-\lambda_\sN&0&\cdots&0\\ 0&\lambda_2-\lambda_\sN&\cdots&0\\ \vdots&\vdots&\ddots&\vdots\\ 0&0&\cdots&0 } }^{\mt{M'}-\lambda_\sN} =\mt{0} \end{align} を満たす。すなわち、$\phi_{\mt{M}}\kakko{\mt{M'}}=\mt{0}$である。

 $\phi_{\mt{M}}\kakko{\xcol{x}}=\phi_{\mt{M'}}\kakko{\xcol{x}}$(相似変換しても行列式は変わらない)なので、$\phi_{\mt{M}}\kakko{\mt{M'}}$は$\phi_{\mt{M'}}\kakko{\mt{M'}}$と書いても同じこと。

 $\phi_{\mt{M}}\kakko{\mt{P^{-1}MP}}=\mt{P^{-1}}\phi_{\mt{M}}\kakko{\mt{M}}\mt{P}$なので、これは$\phi_{\mt{M}}\kakko{\mt{M}}=\mt{0}$と同じことになる。

固有値がすべて異なる場合のCayley-Hamiltonの定理の証明 特性方程式が重解を持つ場合の三角行列化

特性方程式が重解を持つ場合の三角行列化

以下の内容の説明ビデオが↓

 特性多項式が以下のように因数分解されたとしよう。 \begin{align} \phi_{\mt{M}}\kakko{\xcol{x}}= (\xcol{x}-\lambda_1)^{m_1} (\xcol{x}-\lambda_2)^{m_2}\cdots (\xcol{x}-\lambda_k)^{m_k}\label{mklambda} \end{align} $k$は固有値の数で、$N$より小さい整数である。

 ここで$\allc{m_*}$は$\sum_{\dum{j}=1}^k m_{\dum{j}}=N$を満たす1以上の整数($k$は1以上$N$以下の整数となる)で、$m_i$を固有値$\lambda_i$の「重複度」と呼ぶ。すべての重複度$\allc{m_*}$が1ならば前節で考えた場合になる。

 特性方程式が重解を持つときでもCayley-Hamilton定理は成り立ち、 \begin{align} (\mt{M}-\lambda_1)^{m_1} (\mt{M}-\lambda_2)^{m_2}\cdots (\mt{M}-\lambda_k)^{m_k}=\mt{0}\label{mklambdaM} \end{align} である。

 前に述べたように「重解」になるのはたくさんの行列のうちの孤立した「珍しいもの」だけだである。

 たとえば$\mtx{1&1\\-1&3}$は特性方程式が$\lambda^2-4\lambda+4=0$になって重解を持つのだが、これをちょっとだけ変えた行列$\mtx{1&1+\epsilon\\-1&3}$の特性方程式は$\lambda^2-4\lambda+4+\epsilon=0$になって、たとえ$\epsilon$が小さくとも重解ではない。

 「重解」の場合の周囲に存在する「重解にならない行列」からの連続的極限の先に「重解になる行列」があると考えれば「重解でない場合に成り立つ式は重解の場合でも成り立ちそうだな」と予想される(その方向で証明する方法もある)。

 ここでは三角行列化を使った証明を行う。特性方程式に重解があったとしても、固有ベクトルが$N$本見つかったなら前項の証明はそのまま繰り返すことができる。ここでは固有ベクトルが$k$本$(k\lt N)$しか見つからなかった場合を考えよう。そのとき、固有ベクトル以外に「固有ベクトルとは独立なベクトル」が$N-k$本見つかる。これらのベクトルは後で説明する「一般化固有ベクトル(generalized eigenvector)」になっている。

 それらを$\allc{\vec V_*}$として \begin{align} \mt{P_1}=\mtx[c@{}c@{}cc@{}c@{}c]{ \nagatatevec{\vec v_{\fromL\lambda_1}}&\cdots&\nagatatevec{\vec v_{\fromL\lambda_k}} &\nagatatevec{\vec V_{1}}&\cdots&\nagatatevec{\vec V_{N-k}}} \end{align} のような行列を作る。ここで使った列ベクトルは全て独立だから、逆行列を \begin{align} \mt{(P_1)^{-1}}=\mtx[c]{\nagayokovec{~~\vec v^{\lambda_1\fromR}~~}\\[-1mm]\vdots\\\nagayokovec{\vec v^{\lambda_k\fromR}}\\\nagayokovec{\vec V^{1}}\\ \vdots\\\nagayokovec{\vec V^{N-k}}} \end{align} のように作ることができる。これらを使って、 \begin{align} \mt{(P_1)^{-1}MP_1}=&\mtx[ccc@{}c@{}|c]{ \lambda_1&\cdots&0&&\\ \vdots&\ddots&\vdots&&*\\ 0&\cdots&\lambda_k&&\\\hline &\mt{0}&&&\mt{M_1} } \end{align} のように「一部対角化」できる。

左下の部分は$\mt{M}$により固有ベクトルが固有ベクトルではないベクトルに写像されないこおから$\mt{0}$となる。

 ここで対角化できた部分を$\mt{D_1}$、$*$の部分を$\mt{X_1}$と書いて、$ \mt{(P_1)^{-1}MP_1}=\mtx{\mt{D_1}&\mt{X_1}\\\mt{0}&\mt{M_1}}$としておこう。

 この結果はまだ対角行列でも上三角行列でもないが、ここでさらに \begin{align} \mt{P_2}=\mtx[cc]{\mt{I}&\mt{0}\\\mt{0}&\mt{p_2}} \end{align} を使って、すでに対角化された$\mt{D_1}$の部分を壊さないようにしつつ、 \begin{align} \goverbrace{\mtx{\mt{I}&\mt{0}\\ \mt{0}&\mt{(p_2)^{-1}}}}^{ \mt{(P_2)^{-1}}}\goverbrace{\mtx{\mt{D_1}&\mt{X_1}\\\mt{0}&\mt{M_1}}}^{\mt{(P_1)^{-1}MP_1}}\goverbrace{\mtx[cc]{\mt{I}&\mt{0}\\\mt{0}&\mt{p_2}}}^{\mt{P_2}} =\mtx{\mt{D_1}&\mt{X_1p_2}\\ \mt{0}&\mt{(p_2)^{-1}M_1p_2}} \end{align} のように相似変換を続ける。

 $\mt{(p_2)^{-1}M_1p_2}$が対角化行列になっていれば、行列は上三角行列化されたことになる。そうでなかったなら、話を次にすすめる。$\mt{M_1}$という$(N-k)\times(N-k)$行列も固有ベクトルを1本は持っているはずなので、$\mt{(p_2)^{-1}M_1p_2}=\mtx{\mt{D_2}&\mt{X_2}\\\mt{0}&\mt{M_2}}$の形にはできる(対角化できた部分を増やせる)。

 固有ベクトルを$k$本取り出した後だからもう固有ベクトルはない---などということはないのである。なぜなら、今「1本は持っているはず」と言った固有ベクトルは$N\times N$行列$\mt{M}$の固有ベクトルではなく、その「一部」である$(N-k)\times(N-k)$行列$\mt{M_1}$の固有ベクトルなのだ。行列の仕切り直しが行われている。

 これでもまだ三角化が完了してなかった場合は、$\mt{M_2}$の部分について同じ作業を繰り返せば、いつか、全体が上三角行列になる。

 こうしてできた上三角行列の対角成分に$\lambda_1,\lambda_2,\cdots,\lambda_k$があることまではすでにわかっている。残りの$N-k$個が$\lambda'_{k+1},\cdots,\lambda'_\sN$だったとして、$\mt{M}-\xcol{x}\mt{I}$を相似変換した行列(対角成分は$\lambda_i-\xcol{x}$と$\lambda'_i-\xcol{x}$)の行列式を計算すると、 \begin{align} \det\kakko{\mt{P^{-1}}(\mt{M}-\xcol{x}\mt{I})\mt{P}} =\prod_{\dum{i}=1}^k (\lambda_{\dum{i}}-\xcol{x})\times \prod_{\dum[ycolor]{j}=k+1}^N(\lambda'_{\dum[ycolor]{j}}-\xcol{x}) \end{align} となる(三角行列の$\det$には対角成分以外は寄与しない)。相似変換は行列式を変えないはずだから、これは固有多項式に一致しなくてはいけない。つまり$\mt{P^{-1}MP}$の対角成分にはもともとの行列$\mt{M}$の固有値が重複度の回数ずつ現れる。ここで$\mt{P^{-1}NP}$がの形になったことを考えると、$\mt{P^{-1}} \phi_{\mt{M}}\kakko{\mt{M}}\mt{P}$は

$\cdots$

のようになり、この行列の積は0になる。

 上の式の最初にある行列$\mtx[c]{$は1列めがすべて0である。この行列と2個めの行列の掛け算の掛け算の結果は

のように、「1列めと2列めが全て0になった行列」になる。

 その次と掛け算すると今度は3列めも消える。

 以下同様に考えていくと、上の式の計算が終わると全ての行が消える。

 こうして、Cayley-Hamiltonの定理が対角化できない場合でも証明された。

任意の行列の三角行列化

 任意の行列$\mt{M}$は適当な正則行列$\mt{P}$を使って上三角行列の形に相似変換することができる。この結果の上三角行列の対角成分には、特性方程式の解がそれぞれの重複度の回数ずつ登場する。

も同時に示された。

 特性方程式の解が重複している場合にどのようなことが起こるのかについて考えるため、次の節で「一般化固有ベクトル」とそれによるベクトル空間の分解を考えよう。

固有値がすべて異なる場合の対角化 直和分解されたベクトル空間

直和分解されたベクトル空間

 以下の話の説明ビデオは↓

 重複度が1でない固有値がある場合も以下のように直和分解ができる。

一般化固有ベクトルによる直和分解

 特性方程式が \begin{align} \phi_{\mt{M}}\kakko{\xcol{x}}=(\xcol{x}-\lambda_1)^{m_1}(\xcol{x}-\lambda_2)^{m_2}\cdots(\xcol{x}-\lambda_k)^{m_k} \end{align} となる場合、ベクトル空間は \begin{align} \Kerkakko{(\mt{M}-\lambda_1\mt{I})^{m_1}}\oplus\Kerkakko{(\mt{M}-\lambda_2\mt{I})^{m_2}}\oplus\cdots\oplus\Kerkakko{(\mt{M}-\lambda_k\mt{I})^{m_k}} \end{align} のように直和分解される。

 これの証明には、

  1. $\Kerkakko{(\mt{M}-\lambda_i)^{m_i}}$と$\Kerkakko{(\mt{M}-\lambda_j)^{m_j}}$の共通部分は$\vec{0}$しかない。
  2. すべての$\Kerkakko{(\mt{M}-\lambda_i)^{m_i}}$の和は全空間$V$である。

の二つを示さねばならない。

 $\Kerkakko{(\mt{M}-\lambda)^m}$の中に入るベクトル\footnote{線形演算子の$\Ker$は\reftext{Ker部分空間}{部分空間と}なるので、$\Kerkakko{(\mt{M}-\lambda)^m}$も一つのベクトル空間をなす。何次元のベクトル空間になっているのは今はまだわからない。}を、以下のように「一般化固有ベクトル(generalized eigenvector)」と呼ぶ。

一般化固有ベクトル

 $(\mt{M}-\lambda)^m\vec v_{{\fromL^m}{\lambda}}=0$}を満たすベクトル$\vec v_{{\fromL^m}{\lambda}}$を、「行列$\mt{M}$の、固有値$\lambda$を持つ一般化右固有ベクトル」と呼ぶ。

 特に、$(\mt{M}-\lambda)^h\vec v_{{\fromL^{(h)}}{\lambda}}=\vec 0$だが$(\mt{M}-\lambda)^{h-1}\vec v_{{\fromL^{(h)}}{\lambda}}\neq\vec 0$となる$\vec v_{\fromL^{(h)}\lambda}$が存在したとき、$\vec v_{{\fromL^{(h)}}{\lambda}}$を「高さ$h$の一般化右固有ベクトル」と呼ぶ。一般化左固有ベクトルも同様に定義する。

高さ$h$であるときは$\fromL$の上につける添字を$(h)$にして単なる一般化右固有ベクトルと区別することにする。

 $m=1$のときが通常の固有ベクトルである。通常の固有ベクトルが固有値を二つ持つことは有り得ないことは既に示した。ゆえに特性方程式に重解がない場合にベクトル空間は直和分解することができた。

 一般化固有ベクトルの場合で、一つのベクトルが二つ以上の固有値の一般化固有ベクトルになることはありえない(ただし$\vec{0}$を除く)ことを示そう。

 多項式に関するユークリッドの互除法から導かれる定理として、

共通因数を持たない多項式に関する定理

 すべてに共通な因数を持たない多項式の組$\left\{f_1\kakko{\xcol{x}},f_2\kakko{\xcol{x}},\cdots f_k\kakko{\xcol{x}}\right\}$に対し、適切な多項式の組$\left\{A_1\kakko{\xcol{x}},A_2\kakko{\xcol{x}},\cdots,A_k\kakko{\xcol{x}}\right\}$を持ってくれば \begin{align} \sum_{\dmr[ycolor]{i}=1}^k A_{\dml[ycolor]{i}}\kakko{\xcol{x}} f_{\dmr[ycolor]{i}}\kakko{\xcol{x}}=1 \end{align} になるようにできる。

がある(もし共通因数があったら、どうやっても右辺にその共通因数が残る)。

(証明)$k=2$の場合の証明を示す。$f_1\kakko{\xcol{x}}$の方が次数が高いと仮定すると、 \begin{align} f_1\kakko{\xcol{x}}=f_2\kakko{\xcol{x}}h_1\kakko{\xcol{x}}+r_1\kakko{\xcol{x}} \end{align} と書くことが必ずできる。つまり、余り$r_1$は$f_1$と$f_2$の線形結合になる。今$f_1$と$f_2$は互いに素であるから、$r_1\kakko{\xcol{x}}$は0ではなく、$f_2$よりも次数が低い。

 次に$f_2$と$r$に関して \begin{align} f_2\kakko{\xcol{x}}=r_1\kakko{\xcol{x}}h_2\kakko{\xcol{x}}+r_2\kakko{\xcol{x}} \end{align} と書くことが必ずできる。$f_2$と$r_1$は互いに素であるから、$r_2\kakko{\xcol{x}}$(第2段階での余り)はやはり0ではない。

 ここで上の式から$r_1\kakko{\xcol{x}}=f_1\kakko{\xcol{x}}-f_2\kakko{\xcol{x}}h_1\kakko{\xcol{x}}$を代入して、 \begin{align} f_2\kakko{\xcol{x}}=\left(f_1\kakko{\xcol{x}}-f_2\kakko{\xcol{x}}h_1\kakko{\xcol{x}}\right)h_2\kakko{\xcol{x}}+r_2\kakko{\xcol{x}} \end{align} とすることができる。つまり、第2段階の余り$r_2$も、$f_1$と$f_2$に適当な多項式を掛けて作った線形結合で表現できる。

 次は$r_1$と$r_2$に関して \begin{align} r_1\kakko{\xcol{x}}=r_2\kakko{\xcol{x}}h_3\kakko{\xcol{x}}+r_3\kakko{\xcol{x}} \end{align} という式を作り、と続けていくと、第$n$段階の余り$r_n\kakko{\xcol{x}}$は$\xcol{x}$を含まない定数になるのでこれを$R$と置く。 \begin{align} r_{n-2}\kakko{\xcol{x}}=r_{n-1}\kakko{\xcol{x}}h_n\kakko{\xcol{x}}+R \end{align} 上で考えたことから、$R$も$f_1$と$f_2$の線形結合で書かれる。$R$は0ではないから全ての式を$R$で割れば、 \begin{align} A_1\kakko{\xcol{x}}f_1\kakko{\xcol{x}}+A_2\kakko{\xcol{x}}f_2\kakko{\xcol{x}}=1 \end{align} を得る。$k$が大きくなっても同様。

 上の式は$\xcol{x}$を行列$\mt{M}$に変えても成り立つ。「数である$\xcol{x}$の式なら成り立っても、行列では成り立たないのでは?」と心配する人もいるだろうが大丈夫。「数ではいいけど行列だと困る」ことになる原因は「行列の積が交換しないこと」なのだが、今の場合登場する行列は$\mt{M}$と$\mt{I}$だけなので、行列の非可換性が問題になることはないのである。

この結果を使って、特性多項式に関して \begin{align} \sum_{\dum{i}=1}^k A_i\kakko{\xcol{x}}{\phi_{\mt{M}}\kakko{\xcol{x}}\over (\xcol{x}-\lambda_i)^{m_i}}=1\label{projectionA} \end{align} という式をまず作る。${\phi_{\mt{M}}\kakko{\xcol{x}}\over (\xcol{x}-\lambda_i)^{m_i}}$は「分数」になっているので多項式ではないのでは?---と心配になるからもしれないが、$\phi_{\mt{M}}$は$(\xcol{x}-\lambda_i)^{m_i}$を含んでいるので、「割った」というよりは「掛けるのをやめた」ものであり、多項式である。ゆえに上の式を満たすような係数$\allc{A_*\kakko{\xcol{x}}}$を見つけることができる。この$\xcol{x}$を$\mt{M}$に置き換えた式 \begin{align} \sum_{\dum{i}=1}^k A_i\kakko{\mt{M}}{\phi_{\mt{M}}\kakko{\mt{M}}\over (\mt{M}-\lambda_j)^{m_j}}=1\label{projectionM} \end{align} も、もちろん成り立つ(こちらの式の分母に$(\mt{M}-\lambda_i)^{m_i}$があることも、上と同様に考えれば問題はない。実際にはこの計算の中で分数は出てこない)。

 $\Kerkakko{(\mt{M}-\lambda_j)^{m_j}}$に属するベクトルを$\vec v_{\fromL^{m_j}\lambda_j}$と書くことにして\footnote{このベクトルの独立な本数が1とは限らないことに注意。}、このベクトルに上の行列を掛けよう。$j$番目の項$\left(A_j\kakko{\mt{M}}{\phi_{\mt{M}}\kakko{\mt{M}}\over (\mt{M}-\lambda_j)^{m_j}}\right)$以外は因子$(\mt{M}-\lambda_j)^{m_j}$を含むので消えてしまい、 \begin{align} A_j\kakko{\mt{M}}{\phi_{\mt{M}}\kakko{\mt{M}}\over (\mt{M}-\lambda_j)^{m_j}}\vec v_{\fromL^{m_j}\lambda_j}=\vec v_{\fromL^{m_j}\lambda_j} \end{align} となる。すなわち$\left(A_j\kakko{\mt{M}}{\phi_{\mt{M}}\kakko{\mt{M}}\over (\mt{M}-\lambda_j)^{m_j}}\right)$は

という行列になっている(左固有ベクトル$(\vec v_{\lambda_j\fromR})^t$に対しても同様)。これを「$\Ker\kakko{\left(\mt{M}-\lambda_j\mt{I}\right)^{m_j}}$への射影演算子」と呼ぼう。以後、$\mt{\Pi_{\it j}}\equiv A_j\kakko{\mt{M}}{\phi_{\mt{M}}\kakko{\mt{M}}\over (\mt{M}-\lambda_j)^{m_j}}$と書くことにしよう。

 これで、一本のベクトルが$(\mt{M}-\lambda_i\mt{I})^{m_i}=\vec 0$と$(\mt{M}-\lambda_i\mt{I})^{m_i}=\vec 0$の両方を満たす$\vec 0$でないベクトルは存在しないことがわかる。両方を満たすベクトルは、射影演算子$\Pi_*$のどれを掛けても0になるが、$\sum_{\dum{i}=1}^k\Pi_{\dum{i}}=\mt{I}$だから、それは「$\mt{I}$を掛けると$\vec 0$」ということで、そんなベクトルは$\vec 0$だけである。

一般化固有ベクトルによる直和分解 直和分解された空間での行列

直和分解された空間での行列

 以下の話の説明ビデオは↓

 $\mt{M}$は$\mt{M}-\lambda_1\mt{I}$と交換するので、$\Kerkakko{(\mt{M}-\lambda_1\mt{I})^{m_1}}$に属するベクトルは$\mt{M}$を掛けても$\Kerkakko{(\mt{M}-\lambda_1\mt{I})^{m_1}}$内に留まる(つまり、$\Kerkakko{(\mt{M}-\lambda_1\mt{I})^{m_1}}$は、$\mt{M}$の不変部分空間である)。 $\Kerkakko{(\mt{M}-\lambda_1\mt{I})^{m_1}}$と$\Kerkakko{(\mt{M}-\lambda_2\mt{I})^{m_2}}$に重なりがないことも示されたので、$\mtx[c@{\,}c@{}c]{\nagatatevec{\vec v_{{\fromL^{m_1}}{\lambda_1}}}&\nagatatevec{\vec v_{{\fromL^{m_2}}{\lambda_2}}}&\cdots}$と基底を取ることにより、 \begin{align} \goverbrace{ \mtx[cccccc]{ \mt{M_{(1)}}&\mt{0}&\cdots&\mt{0}\\ \mt{0}&\mt{M_{(2)}}&\cdots&\mt{0}\\ \vdots&\vdots&\ddots&\vdots\\ \mt{0}&\mt{0}&\cdots&\mt{M_{(k)}}}}^{\mt{M}} \mtx[c]{ \vec v_{{\fromL^{m_1}}{\lambda_1}} \\ \vec v_{{\fromL^{m_2}}{\lambda_2}} \\ \vdots \\ \vec v_{{\fromL^{m_k}}{\lambda_k}} } \end{align} のように$\mt{M}$がブロック化されることがわかる。

 このように行列が対角ブロックに分けられたとき、 \begin{align} \det\mt{M}=\det\mt{M_{(1)}}\times\det\mt{M_{(2)}}\times\cdots\times\det\mt{M_{(k)}} \end{align} となる。行列から$\xcol{\lambda}\mt{I}$を引いても同じことが言えるので、 \begin{align} \det(\mt{M}-\xcol{\lambda}\mt{I})=\det(\mt{M_{(1)}}-\xcol{\lambda}\mt{I})\times\det(\mt{M_{(2)}}-\xcol{\lambda}\mt{I})\times\cdots\times\det(\mt{M_{(k)}}-\xcol{\lambda}\mt{I}) \end{align} となる(ここに現れる $\mt{I}$はそれぞれ次元が違うことに注意)が、左辺は$(\lambda_1-\xcol{\lambda})^{m_1}(\lambda_2-\xcol{\lambda})^{m_2}\cdots(\lambda_k-\xcol{\lambda})^{m_k}$なので、それらの各因子を \begin{align} \gunderbrace{\det(\mt{M_{(1)}}-\xcol{\lambda}\mt{I})}_{(\lambda_1-\xcol{\lambda})^{m_1}}\times \gunderbrace{\det(\mt{M_{(2)}}-\xcol{\lambda}\mt{I})}_{(\lambda_2-\xcol{\lambda})^{m_2}}\times\cdots\times \gunderbrace{\det(\mt{M_{(k)}}-\xcol{\lambda}\mt{I})}_{(\lambda_k-\xcol{\lambda})^{m_k}} \end{align} のように割り振るしかない。$(\mt{M_{(1)}}-\xcol{\lambda}\mt{I})$は固有値を$\lambda_1$しか持たないはず。よって行列式は$\lambda_1-\xcol{\lambda}$以外の因数を持てない。これは、$\mt{M_{(j)}}$が$m_j\times m_j$行列であることを意味している(つまり、今考えている$\Kerkakko{\left(\mt{M}-\lambda_j\right)^{m_j}}$は$m_j$次元のベクトル空間である)。

 こうして、特性方程式に重解が出る場合も、ベクトル空間を$\Ker(\mt{M}-\lambda\mt{I})^m$で分解できることがわかった。後はそれぞれの分解された空間の中身を考えていけばよい。

その「後はそれぞれの分解された空間の中身を考えていけばよい」の部分は、次回やろう。

 以上で第13回の授業は終わりです。webClassに行って、アンケートに答えてください。

物理数学I webclass

この感想・コメントシートに書かれたことについては、代表的なものに対しては次のページで返答します。

 なお、webClassに情報を載せていますが、木と金の11:50〜12:50の間、オンラインオフィスアワーとしてzoomを開いてます。

 ただし、7月8日(木)は出張中のため、オンラインオフィスアワーは休みです。

 質問や相談などがある人は来て話してください。参加者が少ないので、物理系1年生向けのオフィスアワーと合同になってます。

テキストのPDF版はこちらです(後少し改稿して完成です。印刷版は来週以降に配布します)。
直和分解されたベクトル空間 受講者の感想・コメント

受講者の感想・コメント

対角化の考えが深まった、連立微分方程式を対角化して解く解き、より俯瞰できそうに感じた
対角化というのは、実は量子力学や統計力学などでも大事になる考え方なのです。
今回の授業はCayley-Hamiltonの定理がどのように証明されるのか、また証明する際にどのような作業をしているのかを理解することが出来ました。
いったん証明すると、非常に強力な定理です。
特性方程式が重解を持つ場合は珍しいということで安心した。また、計算自体は大変そうではあるが、やっていることは固有値がすべて異なる場合と同じようなことの繰り返しに思えたので、慣れてしまえば何とか計算できそうだなと感じた。
後でまたやりますが、物理でよくでてくる例(エルミート行列など)の場合は必ず対角化できるので、重解がでても複雑なことにはなりません。
最近の講義では今までに使用してきた手法などを組み合わせて考えたりなど、内容もだんだん難しくなっていると感じています。そこで、何か練習問題などありましたら配布してくださると復習に使用できて嬉しいです。
テキストになるべくつけるようにはしますが、いろいろやってみてください。
固有値が同一でも、左右のかけ方で固有ベクトルが変わるので、対称行列とエルミーと行列のありがたみを感じました。
エルミート行列は物理でも頻出ですが、これのおかげでだいぶ助かります。
今回の講義は特性方程式が重解を持つ場合の三角行列化の説明のところで、つまづいてしまいました。重解の場合の周囲に存在する重解にならない行列からの連続的極限の先に重解になる行列があるという考え方がよくわからなかったです。
そこは説明してないただの紹介なので「そんなのもあるんだな」程度だけ知っててくれればいいです。
直和分解された空間での行列