$\newcommand{\mtxn}[3][cc]{\opcol{\left({\color{black}\begin{array}{@{\,}#1@{\,}}#2\end{array}}\right)^{\!\kuro #3}}}$ $\def\Ker{\opcol{\rm Ker}\,}\def\Kerkakko#1{\opcol{\rm Ker}\haiiro{\left(\kuro{#1}\right)}}\def\Img{\opcol{\rm Im}\,}\def\tr{\opcol{\rm tr}\,}\def\Imgkakko#1{\opcol{\rm Im}\haiiro{\left(\kuro{#1}\right)}}\def\fromR{{\scriptscriptstyle\langle}}\def\fromL{{\scriptscriptstyle\rangle}}$ $\newcommand{\mtx}[2][cc]{\opcol{\left({\color{black}\begin{array}{@{\,}#1@{\,}}#2\end{array}}\right)}}$ $\definecolor{thetacolor}{RGB}{230,0,39}\def\thetacol#1{{\color{thetacolor}#1}}$ $\def\rank{\opcol{\rm rank}\,}$ $\def\kakko#1{\haiiro{\left(\kuro{#1}\right)}}\def\Kakko#1{\haiiro{\left[\kuro{#1}\right]}}\def\coldx{{\color{xcolor}\mathrm dx}}$ $\definecolor{ycolor}{RGB}{217,61,137}\def\ycol#1{{\color{ycolor}#1}}\def\haiiro#1{{\color{hai}#1}}\def\kuro#1{{\color{kuro}#1}}$ $\def\coldr{\rcol{\mathrm dr}}\def\coldvecx{\xcol{\mathrm d\vec x}}\def\intdx{\opcol{\int \mathrm dx}}\def\E{\mathrm e}\def\I{\mathrm i}\definecolor{opcol}{RGB}{149,139,0}\definecolor{hai}{RGB}{137,137,137}\definecolor{tcol}{RGB}{166,54,109}\definecolor{kuro}{RGB}{0,0,0}\definecolor{xcolor}{RGB}{169,103,49}$ $\def\opcol#1{{\color{opcol}#1}}\def\ddx{\opcol{{\mathrm d\over \mathrm dx}}}\def\ddt{\opcol{{\mathrm d\over \mathrm dt}}}\def\scol#1{\color{scolor}#1}$ $\def\ve{\vec{\mathbf e}}\def\colvecx{\xcol{\vec x}}\definecolor{usuopcolor}{RGB}{237,234,203}$ $\def\xcol#1{{\color{xcolor}#1}}$ $\def\gunderbrace{\underbrace}$ $\def\ovalbox{\boxed}\def\kesi#1{\underbrace{#1}_{0}}\newcommand\dum[2][xcolor]{{\color{#1}{\scriptstyle #2}}}\newcommand\dml[2][xcolor]{\,\haiiro{\!\lceil}{\!\color{#1}#2}}\newcommand\dmr[2][xcolor]{{\color{#1}#2}\!\haiiro{\rfloor}\!}}$ $\def\usuopcol#1{\color{usuopcolor}#1}\def\vgrad#1{{\usuopcol{\overrightarrow{\opcol{\rm grad}~\kuro{#1}}}}}\def\dX{\rcol{\mathrm dX}}\def\dY{\thetacol{\mathrm dY}}\def\opdf{\opcol{\mathrm df}}\def\coldf{\tcol{\mathrm df}}\def\dtwof{\opcol{\mathrm d^2f}}\def\murasakidb{\zcol{\mathrm d b}}\def\ao{\ycol}\def\aodV{\ycol{\diff V}}\def\aka{\xcol}\def\akadm{\xcol{\diff m}}$ $\def\psicol#1{{\color{psicolor}#1}}$ $\def\ope#1{\opcol{\hat{#1}}}$ $\def\diff{\mathrm d}\def\kidb{\opcol{\mathrm db}}\def\kidx{\opcol{\mathrm dx}}\def\coldy{\ycol{\mathrm dy}}$ $\def\Odr{{\cal O}}\definecolor{ncol}{RGB}{217,51,43}\def\ncol#1{{\color{ncol}#1}}\definecolor{zcolor}{RGB}{196,77,132}\def\zcol#1{{\color{zcolor}#1}}$ $\def\coldtheta{\thetacol{\mathrm d\theta}}\def\ddtheta{\opcol{{\mathrm d\over\mathrm d\theta}}}\def\tcol#1{{\color{tcol}#1}}\def\coldt{\tcol{\mathrm dt}}\def\kidtheta{\opcol{\mathrm d\theta}}\def\dtwodx{\opcol{\diff^2\over\diff x^2}}\def\kokode#1{~~~~~~~{↓#1}}\def\goverbrace{\overbrace}\def\coldz{\zcol{\mathrm dz}}\def\kidt{\opcol{\mathrm dt}}\definecolor{rcol}{RGB}{206,114,108}\def\rcol#1{{\color{rcol}#1}}\def\coldtwox{\xcol{\mathrm d^2x}}\def\PDC#1#2#3{{\opcol{\left(\opcol{{\partial \kuro{#1}\over \partial #2}}\right)}}_{#3}}\def\PDIC#1#2#3{{\opcol{\left(\opcol{\partial \over \partial #2}\kuro{#1}\right)}}_{#3}}\def\PD#1#2{{{\partial \kuro{#1}\over \partial #2}}}\def\PPDC#1#2#3{{\opcol{\left(\opcol{\partial^2 \kuro{#1}\over \partial #2^2}\right)}}_{#3}}\def\PPDD#1#2#3{{\opcol{{\partial^2 \kuro{#1}\over \partial #2\partial #3}}}}\def\PPD#1#2{{\opcol{{\partial^2 \kuro{#1}\over \partial #2^2}}}}\def\kidy{\opcol{\diff y}}$ $\def\tatevec#1{\boxed{#1}}\def\allc#1{\haiiro{\{}#1\haiiro{\}}}$ $\def\nagatatevec#1{\tatevec{\begin{array}{c}\\#1\\ \\\end{array}}}$ $\def\yokovec#1{\boxed{~~\left(#1\right)^t~~}}$ $\def\yokovecd#1{\boxed{~~\left(#1\right)^\dagger~~}}$ $\def\yokovectnashi#1{\boxed{#1}}$ $\def\nagayokovec#1{\boxed{~~~~~\left(#1\right)^t~~~~~}}$ $\def\nagayokovecd#1{\boxed{~~~~~\left(#1\right)^\dagger~~~~~}}$ $\def\sM{M}\def\sN{N}\definecolor{mxcolor}{RGB}{102,41,71}\def\mxcol#1{{\color{mxcolor}#1}}\newcommand{\mt}[1]{\mxcol{\bf #1}}\newcommand{\rv}[1]{\opcol{\left({\color{black}\begin{array}{@{\,}c@{\,}}#1\end{array}}\right)}}$ $\definecolor{phicolor}{RGB}{153,61,23}\definecolor{psicolor}{RGB}{229,69,115}$ $\def\phicol#1{{\color{phicolor}#1}}$ $\definecolor{rcolor}{RGB}{204,82,122}\definecolor{thetacolor}{RGB}{255,0,38}\definecolor{scolor}{RGB}{178,107,107}$ $\def\avec#1{\xcol{\mathbf #1}}$

「物理数学Ⅰ」2021年度講義録第14回

前回の感想・コメントシートから

 前回の授業の「感想・コメント」の欄に書かれたことと、それに対する返答は、

にありますので見ておいてください。

ビデオ↓
以下は文章による説明。

一般化固有ベクトルの空間

以下では$\Kerkakko{\left(\mt{M}-\lambda\right)^{m}}$という$m$次元の空間のみを考える。よって行列$\mt{M}$も$m\times m$行列として考えていく(もともとの$N\times N$行列$\mt{M}$の直和分解で得られたものと考えてもよい)。 このベクトル空間の基底をどのように取るかを考えていこう。

 まず簡単な場合として$m=2$を考えよう。$\left(\mt{M}-\lambda\mt{I}\right)^2\vec v=\vec 0$を満たすベクトルとして、

が考えられる。

 例を一つ。$\mtx{2&1\\0&2}$という行列を考える。この行列の特性方程式は$(2-\lambda)^2=0$であるから固有値は$2$で、$\mt{M}-\lambda\mt{I}=\mtx{0&1\\0&0}$となる。

 $\mtxn{0&1\\0&0}{2}=0$だから、$\mtx[c]{1\\0}$も$\mtx[c]{0\\1}$も$\Ker\left(\mt{M}-\lambda\mt{I}\right)^2$に入る。$\mtx[c]{1\\0}$は$\mtx{0&1\\0&0}$を掛けると0(つまり上の(1)のケース)であり、$\mtx[c]{0\\1}$は$\mtx{0&1\\0&0}$を掛けると$\mtx[c]{1\\0}$になり、$\vec 0$ではない。$\mtx{0&1\\0&0}$をもう一度掛けると$\vec 0$になる(つまり上の(2)のケース)。

 このあたりの計算で、線形二階微分方程式を解いていて特性方程式が重解になったとき、つまり微分方程式が$\left(\opcol{\diff \over \kidx}-\lambda\right)^2 f\kakko{\xcol{x}}=0$の形になったときのことを思い出した人もいるかもしれない。あのときも解が
  1. $\left(\opcol{\diff \over \kidx}-\lambda\right)f\kakko{\xcol{x}}=0$を満たす関数
  2. $\left(\opcol{\diff \over \kidx}-\lambda\right)f\kakko{\xcol{x}}\neq 0$だが$\left(\opcol{\diff \over \kidx}-\lambda\right)^2f\kakko{\xcol{x}}=0$になる関数
の2種類があった。

 そして(1)に属するベクトルの中には、

が有り得る。上の箱の中で考えた$\mtx[c]{1\\0}$は$\mtx{0&1\\0&0}\mtx[c]{0\\1}$と表現できるので、(1-a)のケースである。

ジョルダン鎖

ジョルダン鎖

 以下の話の説明ビデオは↓

 前ページで述べたように、$\Ker\kakko{\left(\mt{M}-\lambda\mt{I}\right)^m}$の中には、「$(\mt{M}-\lambda\mt{I})$を掛けることによって作られる一連の複数のベクトルの組」が現れるので、これに「ジョルダン鎖(Jordan chain)」という名前をつけよう。この場合の「鎖(chain)」は「連鎖反応(chain reaction)」の「連鎖」に近い意味あいを持つ言葉である。前ページの例なら、$\mtx[c]{0\\1}\to \mtx[c]{1\\0}$がジョルダン鎖である。

ジョルダン鎖
 $(\mt{M}-\lambda\mt{I})^{h}\vec v=\vec{0}$で$(\mt{M}-\lambda\mt{I})^{h-1}\vec v\neq\vec{0}$であるベクトル(高さ$h$の一般化固有ベクトル)があったとすると、掛ける$\mt{M}-\lambda\mt{I}$の数が$h$より少ないベクトルを集めて作った一連の複数のベクトルの集合 \begin{align} \vec v,(\mt{M}-\lambda\mt{I})\vec v,(\mt{M}-\lambda\mt{I})^2\vec v,\cdots,(\mt{M}-\lambda\mt{I})^{h-1}\vec v\label{Jchain} \end{align} を「ジョルダン鎖」と呼ぶ。これらはすべて$\Kerkakko{(\mt{M}-\lambda\mt{I})^{h}}$に属する。

 イメージとしては、$\vec v$が一番「高い」ベクトルで、$\mt{M}-\lambda\mt{I}$を掛けるごとに「下がる」と考えればよい。もっとも低い$,(\mt{M}-\lambda\mt{I})^{h-1}\vec v$はもう一つ$\mt{M}-\lambda\mt{I}$を掛けると0になる(つまり$\mt{M}$の通常の意味での固有ベクトル)。

以下のことが言える。

ジョルダン鎖は線形独立

 ジョルダン鎖に属するベクトル \begin{align} \vec v,(\mt{M}-\lambda\mt{I})\vec v,(\mt{M}-\lambda\mt{I})^2\vec v,\cdots,(\mt{M}-\lambda\mt{I})^{h-1}\vec v \end{align} (全部で$h$本)は線形独立である。

 証明しよう。これらが線形独立でない、すなわち \begin{align} \sum_{\dum{i}=0}^{h-1} \alpha_{\dml{i}}(\mt{M}-\lambda\mt{I})^{\dmr{i}}\vec v=\vec 0 \end{align} を満たす0ではない係数$\allc{\alpha_*}$が存在するとまず仮定する。この式に前から$(\mt{M}-\lambda)\mt{I}^{h-1}$を掛けると第1項以外は$(\mt{M}-\lambda\mt{I})^{h}\vec v=0$から0になり、 \begin{align} \alpha_0(\mt{M}-\lambda\mt{I})^{h-1}\vec v=\vec{0} \end{align} となってしまう。$\alpha_0\neq0$であれば、$(\mt{M}-\lambda)^{h-1}\vec v=\vec{0}$となって仮定に反する。$\alpha_0=0$であれば、$i=0$の項がなくなった \begin{align} \sum_{i=1}^{h-1} \alpha_i(\mt{M}-\lambda\mt{I})^i\vec v=0 \end{align} が成り立つ。これに$(\mt{M}-\lambda\mt{I})^{h-2}$を掛ければ今度は$\alpha_1(\mt{M}-\lambda\mt{I})^{h-1}\vec v=\vec{0}$となる。よって$\alpha_1$が0になってしまい、同様の手順を繰り返すことにより最後には$(\mt{M}-\lambda\mt{I})^{h-1}\vec v=\vec{0}$となって仮定に反する。

 つまり、「高さ$h$の一般化固有ベクトル」が見つかったら、$m$次元空間の$\Kerkakko{\left(\mt{M}-\lambda\right)^{m}}$の中に$h$本の基底ベクトルを見つけたことになる。$h=m$であればすべての基底ベクトルを見つけたことになるが、そうでない場合は残る$m-h$次元の空間の中にどんなベクトルがあるかを探っていく。

前回の感想・コメントシートから ジョルダン鎖を基底とした行列

ジョルダン鎖を基底とした行列

 以下の話の説明ビデオは↓

 以下では$h=m$として考える(そうでない場合は、空間を分けて考え直せばよい)。前項のようにして見つけた独立なベクトルの組を \begin{align} \vec v_{(i)}=(\mt{M}-\lambda\mt{I})^{h-i}\vec v~~~(1\le i \le h)\label{Jchainh} \end{align} と書くことにする($\vec v_{(h)}=\vec v$として、$\mt{M}-\lambda\mt{I}$が掛かるごとに添字の()内の数字が下るようにした))。これに$\mt{M}$を掛けるとどうなるかを見てみよう。$\mt{M}=\lambda+(\mt{M}-\lambda)$を使って、 \begin{align} \mt{M}\vec v_{{(i)}}=\lambda\vec v_{{(i)}}+\gunderbrace{(\mt{M}-\lambda\mt{I})\vec v_{{(i)}}}_{\vec v_{{(i-1)}}} \end{align} が成り立つことがわかる(ただし$i=h$のときは右辺第1項は0)。つまり、$\mt{M}$を掛けた結果は元のベクトルを$\lambda$倍したものと一つ$\mt{M}-\lambda\mt{I}$のべきが上がったベクトルの和となり、 \begin{align} & \mt{M}\goverbrace{\mtx[c@{\,}c@{\,}c@{\,}c]{\nagatatevec{\vec v_{{(1)}}}&\nagatatevec{\vec v_{{(2)}}}&\cdots&\nagatatevec{\vec v_{{(h-1)}}}}}^{\mt{P}} =\mtx[c@{\,}c@{\,}c@{\,}c]{\nagatatevec{\lambda\vec v_{{(1)}}}&\nagatatevec{\lambda\vec v_{{(2)}}+\vec v_{{(1)}}}&\cdots&\nagatatevec{\lambda\vec v_{{(h)}}+\vec v_{(h-1)}} } \end{align} と表現できる。この式は \begin{align} & (\mt{M}-\lambda\mt{I})\mtx[c@{\,}c@{\,}c@{\,}c]{\nagatatevec{\vec v_{{(1)}}}&\nagatatevec{\vec v_{{(2)}}}&\cdots&\nagatatevec{\vec v_{{(h)}}}} =\mtx[c@{\,}c@{\,}c@{\,}c]{\nagatatevec{\vec 0}&\nagatatevec{\vec v_{{(1)}}}&\cdots&\nagatatevec{\vec v_{(h-1)}}} \end{align} と書いてもよい。

↑最初、この式のベクトルの順が逆でした。訂正しました。

「$(\mt{M}-\lambda\mt{I})$が、$\vec v_{(i)}$の添字$i$を下げる」というイメージである。

 この$\mt{P}$を使った相似変換を行うと、 \begin{align} \mt{P^{-1}MP}=\mtx[cccccc]{\lambda&1&0&\cdots&0&0\\0&\lambda&1&\cdots&0&0\\[-1mm]0&0&\lambda&\ddots&0&0\\[-1mm]\vdots&\vdots&\vdots&\ddots&\ddots&\vdots\\0&0&0&\cdots&\lambda&1\\0&0&0&\cdots&0&\lambda}\end{align} となる。この行列は「元のベクトルを$\lambda$倍したものと一つ$\mt{M}-\lambda\mt{I}$のべきが上がったベクトル」を作る行列になっている。

 この形の行列を「ジョルダン細胞(Jordan cell)」英単語「cell」はもともと「小部屋」という意味で、転じて生物の「細胞」の意味をも持つ。と呼ぶ。$n\times n$で固有値$\lambda$のジョルダン細胞を$J_n\kakko{\lambda}$と書くことにすると、 \begin{align} J_1\kakko{\lambda}=\mtx[c]{\lambda},~~ J_2\kakko{\lambda}=\mtx[cc]{\lambda&1\\0&\lambda},~~ J_3\kakko{\lambda}=\mtx[ccc]{\lambda&1&0\\0&\lambda&1\\0&0&\lambda},\cdots \end{align} である。$J_1$は単なる数(固有値)であり、$J_2$以上がある場合にジョルダン鎖が存在する。

 以下の行列は相似変換するとジョルダン細胞になる。実行せよ。

(1)$\mtx{2&1\\-1&0}$~~~~~(2)$\mtx[ccc]{3&-1&0\\-2&2&1\\-2&-3&4}$

ここをクリックすると答えがある。

(1)  特性方程式が$(2-\lambda)\lambda+1=(\lambda-1)^2=0$で固有値は1で重解。$\mt{M}-\lambda\mt{I}=\mtx{1&1\\-1&-1}$なので、固有ベクトルは$\mtx[c]{1\\-1}$。ジョルダン鎖を作るために、 $\mtx[c]{1\\-1}=\mtx{1&1\\-1&-1}\mtx[c]{?\\?}$となるベクトルを探すと、$\mtx[c]{1\\-1}=\mtx{1&1\\-1&-1}\mtx[c]{1\\0}$であるから、もう一つの列ベクトルを$\mtx[c]{1\\0}$と選ぶ。相似変換のための行列を$\mt{P}=\mtx{1&1\\-1&0}$とする。逆行列は$\mt{P^{-1}}=\mtx{0&-1\\ 1&1}$であるから、 \begin{align} \mtx{0&-1\\ 1&1}\mtx{2&1\\-1&0}\mtx{1&1\\-1&0}=\mtx{0&-1\\ 1&1}\mtx{1&2\\-1&-1}=\mtx{1&1\\0&1} \end{align}

(2) 特性方程式が$(3-\lambda)(2-\lambda)(4-\lambda)+2-2(4-\lambda)+3(3-\lambda)=(\lambda-3)^3$で三重解。$\mt{M}-\lambda\mt{I}=\mtx[ccc]{0&-1&0\\-2&-1&1\\-2&-3&1}$で、これを掛けて0になるベクトルは$\mtx[c]{a\\0\\2a}$の形なので、まずジョルダン鎖の最初のメンバーを$\mtx[c]{1\\0\\2}$とする。

 $\left(\mt{M}-\lambda\mt{I}\right)^2=\mtx[ccc]{2&1&-1\\0&0&0\\4&2&-2}$だが、これを掛けて0になるベクトルは$\mtx[c]{a\\b\\2a+b}$の形。$\mtx[c]{1\\0\\2}=\mtx[ccc]{0&-1&0\\-2&-1&1\\-2&-3&1}\mtx[c]{0\\-1\\-1}$という式が作れるので、ジョルダン鎖のメンバーとして$\mtx[c]{0\\-1\\-1}$を採用する。

 最後のジョルダン鎖のメンバーとしてはこれまでの2本と独立になるようにとる。$\mtx[c]{0\\-1\\-1}=\mtx[ccc]{0&-1&0\\-2&-1&1\\-2&-3&1}\mtx[c]{0\\0\\-1}$}となるので$\mtx[c]{0\\0\\-1}$を使う。$\mt{P}=\mtx[ccc]{1&0&0\\0&-1&0\\2&-1&-1}$として、 \begin{align} \mtx[ccc]{1&0&0\\0&-1&0\\2&1&-1}\mtx[ccc]{3&-1&0\\-2&2&1\\-2&-3&4}\mtx[ccc]{1&0&0\\0&-1&0\\2&-1&-1}=\mtx[ccc]{3&1&0\\0&3&1\\0&0&3} \end{align}

ジョルダン鎖 ジョルダン標準形

ジョルダン標準形

以下の内容の説明ビデオが↓

 ここまでの話からすると、

とわかる。

 ゆえに行列は相似変換により、以下に示す「ジョルダン標準形(Jordan normal form)」にできる。 \begin{align} \mtx[c@{\,}c@{\,}c@{\,}c|c@{\,}c@{\,}c|c@{\,}c@{\,}c]{ J_{m_{1,1}}\kakko{\lambda_1}&&&&&&&&\\[2mm] &J_{m_{1,2}}\kakko{\lambda_1}&&&&&&&&\\ &&\ddots&&&&&&&\\ &&&J_{m_{1,c_1}}\kakko{\lambda_1}&&&&\\[2mm]\hline &&&&J_{m_2,1}\kakko{\lambda_2}&&&\\ &&&&&\ddots&&\\ &&&&&&J_{m_2,c_2}\kakko{\lambda_2}&\\ \hline &&&&&&&J_{m_3,1}\kakko{\lambda_3}&\\ &&&&&&&&\ddots } \end{align} $c_i$は固有値$\lambda_i$の部分空間に掛かる行列が何個のジョルダン細胞を持っているかを表す数字で、$m_{i,j}$は$j$番目のジョルダン細胞の行列の行数(列数)である。

 ジョルダン細胞が全て$J_1$である場合、この行列は対角行列である。それ以外の場合は上三角行列になっている。

 ジョルダン標準形が便利なのは、この形の行列を使った計算方法がたくさん作られていることである(次回で少し紹介する)。

ジョルダン鎖を基底とした行列 対角化可能条件

対角化可能条件

 以下の話の説明ビデオは↓

 行列$\mt{M}$が、正則な行列$\mt{P}$を選ぶことで相似変換により$\mt{P^{-1}MP}$を対角行列にできるとき、「$\mt{M}$は対角化可能である」と言う。この節では、行列が対角化可能であるための条件を考えていこう。

 ここまでの対角化の手法を見ていくと、次の条件があることはすぐにわかるだろう。

対角化可能条件と固有ベクトルの本数

 $N\times N$行列が固有ベクトル(右固有ベクトルでも左固有ベクトルでも可)を$N$本持っていることは、対角化可能であることの必要十分条件である。

 まず右固有ベクトルが$N$本ある$\Rightarrow$対角化可能を示そう。右固有ベクトルが$N$本あるとしたのだから、それらを$\allc{\vec v_{*}}$($=\vec v_{1},\vec v_{2},\cdots\vec v_{\lambda_{{\sN}}}$)としてこの空間の基底に採用しよう。それぞれのベクトルは$\mt{M}\vec v_i=\lambda_i\vec v_i$を満たすとする(固有値$\allc{\lambda_*}$の中には同じものがあってもよい)。このベクトルを列ベクトルにして並べた行列$\mt{P}=\mtx[c@{\,}c@{}c@{}c]{\nagatatevec{\vec v_{1}}&\nagatatevec{\vec v_{2}}&\cdots&\nagatatevec{\vec v_{\sN}}}$を作り、固有ベクトル$\allc{\vec v_{*}}$を基底としたときの双対基底$\allc{\vec v^*}$を用意して、これを行ベクトルにして並べることで逆行列$\mt{P^{-1}}$を作る。

 $\mt{P}$と$\mt{P^{-1}}$により、$\mt{M}$は \begin{align} &\goverbrace{\mtx[c]{\nagayokovec{\vec v^{\,1}}\\\nagayokovec{\vec v^{\,2}}\\\vdots\\\nagayokovec{\vec v^\sN}}}^{\mt{P^{-1}}} ~~\mt{M}~~\goverbrace{\mtx[c@{\,}c@{}c@{}c]{\nagatatevec{\vec v_{1}}&\nagatatevec{\vec v_{2}}&\cdots&\nagatatevec{\vec v_{\sN}}}}^{\mt{P}}\nonumber\\ =&\mtx[c]{\nagayokovec{\vec v^{\,1}}\\\nagayokovec{\vec v^{\,2}}\\\vdots\\\nagayokovec{\vec v^\sN}} \mtx[c@{\,}c@{}c@{}c]{\nagatatevec{\mt{M}\vec v_{1}}&\nagatatevec{\mt{M}\vec v_{2}}&\cdots&\nagatatevec{\mt{M}\vec v_{\sN}}} \nonumber\\ =&\mtx[c]{\nagayokovec{\vec v^{\,1}}\\\nagayokovec{\vec v^{\,2}}\\\vdots\\\nagayokovec{\vec v^\sN}} \mtx[c@{\,}c@{}c@{}c]{\nagatatevec{\lambda_1\vec v_{1}}&\nagatatevec{\lambda_2\vec v_{2}}&\cdots&\nagatatevec{\lambda_\sN\vec v_{\sN}}} =\mtx[c@{\,}c@{}c@{}c]{\lambda_1&0&\cdots&0\\0&\lambda_2&\cdots&0\\[-2mm]\vdots&\vdots&\ddots&\vdots\\[-1mm]0&0&\cdots&\lambda_\sN}\label{taikakuM} \end{align} となって、対角化される。「左固有ベクトルが$N$本ある」を出発点とするなら、先に$\mt{P^{-1}}$の方ができるだけで、後は同じである。

 この逆右固有ベクトルが$N$本ある$\Leftarrow$対角化可能は簡単で、対角化可能なら対角化するための行列$\mt{P}$があることなのだから、その行列を列ベクトルにばらせば、「独立な右固有ベクトル$N$本の組」ができる。同様に、$\mt{P^{-1}}$の方から、「独立な左固有ベクトル$N$本の組」が得られる。

ジョルダン標準形 ユニタリ行列による対角化と正規行列

ユニタリ行列による対角化と正規行列

 以下の話の説明ビデオは↓

 相似変換による対角化のなかで、特に重要なのが「ユニタリ行列」による対角化である。ユニタリ行列の定義を述べる。

ユニタリ行列

 $\mt{UU^\dagger}=\mt{U^\dagger U}=\mt{I}$}を満たす正方行列、すなわち$\mt{U^\dagger}=\mt{U^{-1}}$である行列を「ユニタリ行列(unitary matrix)」と呼ぶ。

 ユニタリ行列はいわば、「直交行列の複素化」である。直交行列が「直交」なのは「行列を列ベクトルの組とみたとき、列ベクトルは相互に直交している(内積が0)」という意味であったが、ユニタリ行列も、 \begin{align} \goverbrace{\mtx[c]{ \nagayokovecd{\vec v_1}\\ \nagayokovecd{\vec v_2}\\ \vdots\\ \nagayokovecd{\vec v_\sN} }}^{\mt{U^\dagger}} \goverbrace{\mtx[c@{\,}c@{\,}c@{\,}c]{ \nagatatevec{\vec v_1} &\nagatatevec{\vec v_2} &\cdots&\nagatatevec{\vec v_\sN} }}^{\mt{U}}=\mt{I} \end{align} と考えると、「$\mt{U}$を列ベクトルの組とみなしたときの列ベクトル」が複素ベクトル空間の直交条件$(\vec v_i)^\dagger\vec v_j=\delta_{ij}$を満たしている。

複素ベクトルの内積$\vec v\cdot\vec w$は$(\vec v)^\dagger \vec w$で定義されていることに注意。
ユニタリ変換

 列ベクトルを$\vec a\to \mt{U}\vec a$、行ベクトルを$(\vec b)^\dagger \to (\vec b)^\dagger \mt{U^\dagger}$と変換し、同時に行列を$\mt{M}\to \mt{UMU^\dagger}$と変換することを「ユニタリ変換(unitary transformation)」と呼ぶ。

 相似変換に使う行列$\mt{P}$を列ベクトルに分けた組は「独立」という条件を満たしていればよかったが、ユニタリ変換に使う行列$\mt{U}$を列ベクトルに分けたときは「互いに直交して、ノルムが1」という条件を満たさなくてはいけないことである。

 この行列による変換は複素ベクトルの内積$\vec a\cdot\vec b=\yokovecd{\vec a}\,\tatevec{\,\vec b\,}$}を保存する。すなわち、$\tatevec{\,\vec a\,}\longrightarrow \mt{U}\tatevec{\,\vec a\,},\tatevec{\,\vec b\,}\longrightarrow \mt{U}\tatevec{\,\vec b\,}$という変換に対して、 \begin{align} \yokovecd{\vec a}\tatevec{\,\vec b\,}\longrightarrow \yokovecd{\vec a}\mt{U^\dagger U}\tatevec{\,\vec b\,}=\yokovecd{\vec a}\tatevec{\,\vec b\,} \end{align} と変換される(性質$\mt{U^\dagger U}=\mt{I}$を使った)。

 行列がユニタリ変換で対角化できる条件が以下であることが知られている。

対角化可能条件と正規行列

 正方行列$\mt{M}$が$\mt{M^\dagger M}=\mt{MM^\dagger}$を満たす(このような行列を「正規行列」と呼ぶ)ことは、ユニタリ変換で対角化可能であることの必要十分条件である。

 $\mt{M^\dagger M}=\mt{MM^\dagger}$を満たさない行列はたくさんあるたとえば、$\mtx{0&1\\0&0}\mtx{0&0\\1&0}\neq\mtx{0&0\\1&0}\mtx{0&1\\0&0}$。

 まず、ユニタリ変換で対角化可能$\Longrightarrow\mt{M^\dagger M}=\mt{MM^\dagger}$を示す。ユニタリ行列を使って$\mt{M'}=\mt{UMU^\dagger}$と対角化する。この式全体のエルミート共役を取ると、$\mt{(AB)}^\dagger=\mt{B^\dagger}\mt{A^\dagger}$なので(エルミート共役は「転置+複素共役」であるから、転置のときに順番が入れ替わる)、 \begin{align} \left(\mt{UMU^\dagger}\right)=(\mt{U^\dagger})^\dagger\mt{M^\dagger}\mt{U^\dagger} =\mt{UM^\dagger U^\dagger} \end{align} となる。$\mt{UMU^\dagger}$が対角行列だったので、そのエルミート共役である$\mt{UM^\dagger U^\dagger}$も対角行列である。対角行列どうしは交換するから、 \begin{align} \mt{UM}\gunderbrace{\mt{U^\dagger U}}_{\mt{I}}\mt{M^\dagger U^\dagger} = \mt{UM^\dagger}\gunderbrace{\mt{U^\dagger}\mt{U}}_{\mt{I}}\mt{MU^\dagger} \end{align} である。これを逆ユニタリ変換(左から$\mt{U^\dagger}$、右から$\mt{U}$を掛ける)すれば$\mt{MM^\dagger}=\mt{M^\dagger M}$となる。

 この逆$\mt{M^\dagger M}=\mt{MM^\dagger}\Longrightarrow$ユニタリ変換で対角化可能を示すため、まず$\mt{M}$の固有ベクトルと$\mt{M^\dagger}$の固有ベクトルの関係を示しておく。$\vec v_{\fromL\lambda}$が$\mt{M}\vec v_{\fromL\lambda}=\lambda\vec v_{\fromL\lambda}$、すなわち$(\mt{M}-\lambda\mt{I})\vec v_{\fromL\lambda}=\vec 0$を満たすとすると、「零ベクトルのノルムは0」なので \begin{align} \left|(\mt{M}-\lambda\mt{I})\vec v_{\fromL\lambda}\right|^2=0~~\rightarrow~~ \left(\vec v_{\fromL\lambda} \right)^\dagger\left(\mt{M^\dagger}-\lambda^*\mt{I}\right)(\mt{M}-\lambda\mt{I})\vec v_{\fromL\lambda}=0 \end{align} が言える。ところが$\mt{M}$と$\mt{M^\dagger}$は交換するから、 \begin{align} \left(\vec v_{\fromL\lambda} \right)^\dagger(\mt{M}-\lambda\mt{I})\left(\mt{M^\dagger}-\lambda^*\mt{I}\right)\vec v_{\fromL\lambda}=0~~\rightarrow~~ \left|(\mt{M^\dagger}-\lambda^*\mt{I})\vec v_{\fromL\lambda}\right|^2=0 \end{align} でもある。よって、$\left(\mt{M^\dagger}-\lambda^*\mt{I}\right)\vec v_{\fromL\lambda}=\vec 0$である。つまり、($\mt{M}$と$\mt{M^\dagger}$が交換するなら)$\mt{M}$の固有ベクトル(固有値$\lambda$)は、同時に$\mt{M^\dagger}$の固有ベクトル(固有値$\lambda^*$)でもある。

 $\dagger$を取ると$\left(\vec v_{\fromL\lambda} \right)^\dagger(\mt{M}-\lambda\mt{I})=\vec 0$も導ける。この式を使って、固有値が違う二つの固有ベクトルの内積について \begin{align} \gunderbrace{(\vec v_{\fromL\lambda})^\dagger \mt{M}}_{こっちを先に計算}\vec v_{\fromL\lambda'} =&\lambda (\vec v_{\fromL\lambda})^\dagger \vec v_{\fromL\lambda'}\nonumber\\ (\vec v_{\fromL\lambda})^\dagger \gunderbrace{\mt{M}\vec v_{\fromL\lambda'}}_{こっちを先に計算} =&\lambda' (\vec v_{\fromL\lambda})^\dagger \vec v_{\fromL\lambda'} \end{align} の二つから、 $\lambda\neq\lambda'$のときに$ (\vec v_{\fromL\lambda})^\dagger \vec v_{\fromL\lambda'}=0$が言える。これは固有値の違う固有ベクトルが互いに直交することを意味する。前にエルミート行列の場合こうなる、という説明をしたが、実はエルミート行列でない場合でも正規行列ならこれが言える。同じベクトルどうしの内積(ノルムの自乗)は正になるが、これが1になるように規格化したとしよう(もし同じ固有値のベクトルが何本かある場合はGram-Schmidtを使って直交規格化しておこう)。

 次に、$\mt{M}$が正規行列の場合はジョルダン鎖を持てないことを示す。ベクトルの列$ \vec v_{(i)}=(\mt{M}-\lambda\mt{I})^{h-i}\vec v~~~(1\le i \le h)$が存在していたとしよう。

ジョルダン鎖 \begin{align} (\mt{M}-\lambda\mt{I}){\vec v_{(h)}}=&{\vec v_{(h-1)}}\\ \vdots&\nonumber\\ (\mt{M}-\lambda\mt{I}){\vec v_{(2)}}=&{\vec v_{(1)}}\\ (\mt{M}-\lambda\mt{I}){\vec v_{(1)}}=&\vec 0\label{vnzero} \end{align} は、上のような一連の式が成り立つ。「$\vec v_{(h)}$が一番高く、$\mt{M}-\lambda\mt{I}$を掛けると下がっていく。一番底が$\vec v_{(1)}$」というイメージである。

 上で考えたのと同様にして、「$(\mt{M}-\lambda\mt{I})\vec v_{(1)}$のノルムが0」→「$(\mt{M^\dagger}-\lambda^*\mt{I})\vec v_{(1)}$のノルムも0」→「$(\mt{M}^\dagger-\lambda^*\mt{I}){\vec v_{(1)}}=\vec 0$」が言える。

 その式のエルミート共役$({\vec v_{(1)}})^\dagger (\mt{M}-\lambda\mt{I})=(\vec 0)^\dagger$に右から$\vec v_{(2)}$を掛けると、 \begin{align} ({\vec v_{(1)}})^\dagger \gunderbrace{(\mt{M}-\lambda\mt{I})\vec v_{(2)}}_{\vec v_{(1)}}=0 \end{align} となるが、これは$ ({\vec v_{(1)}})^\dagger\vec v_{(1)}=0$($\vec v_{(h-1)}$のノルムが0)で、$\vec v_{(1)}=\vec 0$を意味する。ゆえに、ジョルダン鎖が存在できない。

 ということは$\mt{M}$の特性方程式が$\lambda$の重解を持っていたとしても、ベクトル空間の中にジョルダン鎖ができることはなく、$N$次元空間なら$N$本の固有ベクトル$\vec v_{\fromL\lambda}$でその空間が張られていることになる。そしてその$N$本の固有ベクトルは互に直交する。このとき対角化のために使われる行列$\mt{P}=\mtx[cccc]{\tatevec{\vec v_{\fromL\lambda_1}}&\tatevec{\vec v_{\fromL\lambda_2}}&\cdots&\tatevec{\vec v_{\fromL\lambda_\sN}}}$はユニタリ行列である。そして、$\mt{P^\dagger}=\mtx[c]{\yokovecd{(\vec v_{\fromL\lambda_1}}\\\yokovecd{\vec v_{\fromL\lambda_2}}\\\vdots\\\yokovecd{\vec v_{\fromL\lambda_\sN}}}$が正しく$\mt{P}$の逆行列となっている。

 この定理から、エルミート行列($\mt{H}=\mt{H^\dagger}$を満たす行列)とユニタリ行列($\mt{U^{-1}}=\mt{U^\dagger}$を満たす行列)は常にユニタリ変換で対角化可能であることがわかる。

 エルミート行列(一般化するとエルミート演算子)がユニタリ変換で対角化できることは、量子力学等で重要である。

対角化可能条件 第2回レポート問題

第2回レポート問題

 以下をレポート問題とします。webClassの方で提出してください。

  1. 相似変換すると$\mtx{2&1\\0&2}$になる行列を一つ見つけて、「相似変換して$\mtx{2&1\\0&2}$になる過程」を記せ。
  2. ユニタリ変換して$\mtx{1&0\\0&-1}$になる行列を一つ見つけて、「ユニタリ変換して$\mtx{1&0\\0&-1}$になる過程」を記せ。

 「一つ見つける」過程は書かなくてよい。

 ↑締切は8月4日の23:59までとします。

 試験は予定の8月5日(木)の2限に、蜜を避けて、

のように受講者を半分ずつに分けて実施する予定です(場所はC114)。

 試験は60点満点で、レポートは40点満点です。

のうち、高い方の点数で成績判定します。レポート出してない、もしくはレポートのできがよくなかった人は、試験で挽回してください。

 以上で第14回の授業は終わりです。webClassに行って、アンケートに答えてください。

物理数学I webclass

この感想・コメントシートに書かれたことについては、代表的なものに対しては次のページで返答します。

 なお、webClassに情報を載せていますが、木と金の11:50〜12:50の間、オンラインオフィスアワーとしてzoomを開いてます。

 質問や相談などがある人は来て話してください。参加者が少ないので、物理系1年生向けのオフィスアワーと合同になってます。

テキストのPDF版はこちらです。
テキストの印刷冊子がありますので、前野の部屋(A307)まで取りに来てください。
対角化可能条件 受講者の感想・コメント

受講者の感想・コメント

ユニタリ行列のとこは一度学んだことがあったのですんなりと分かったが、ジョルダン鎖や、ジョルダン標準形は理解するのに手こずった。
ややこしいところではありますが、いったん理屈がわかれば大丈夫だと思います。
相似変換でジョルダン細胞にする過程が少し怪しかったので、しっかり復習しようと思いました。期末も近くなって来たので頑張ります。
頑張ってください。
ジョルダン鎖に属するベクトルは線型独立である事やN×N行列がN本の独立な固有ベクトルを持っていれば対角化ができる事を学べました。  ユニタリ変換は、複素ベクトルの内積を保存するため量子力学の分野で重宝されると知ることができました。
ベクトル空間に独立なベクトルが選び出せる、というのが対角化の肝です。そのあたりが量子力学などでも使われる。
いままで中途半端な行列だと思っていたものがジョルダン標準形という名前があるものだと知って驚いた。今はまだ、いまいちこの行列の有用性が理解でいていないが、これを使った計算方法がたくさんあるということなのでしっかり理解していきたい
相似変換したら全部あの形にできるので「標準形」です。ただ、物理ででてくるのは対角化できる行列が多いです(とはいえ、だからジョルダン標準形知らなくていいわけではない)。
今回の授業ではジョルダン鎖について理解でき、ジョルダン細胞がどのような形の行列で相似変形するとジョルダン細胞になる行列をどのように変形していけばいいか理解することが出来ました。
計算やってみてください。
第2回レポート問題