$\newcommand{\mtxn}[3][cc]{\opcol{\left({\color{black}\begin{array}{@{\,}#1@{\,}}#2\end{array}}\right)^{\!\kuro #3}}}$ $\def\Ker{\opcol{\rm Ker}\,}\def\Kerkakko#1{\opcol{\rm Ker}\haiiro{\left(\kuro{#1}\right)}}\def\Img{\opcol{\rm Im}\,}\def\tr{\opcol{\rm tr}\,}\def\Imgkakko#1{\opcol{\rm Im}\haiiro{\left(\kuro{#1}\right)}}\def\fromR{{\scriptscriptstyle\langle}}\def\fromL{{\scriptscriptstyle\rangle}}$ $\newcommand{\mtx}[2][cc]{\opcol{\left({\color{black}\begin{array}{@{\,}#1@{\,}}#2\end{array}}\right)}}$ $\definecolor{thetacolor}{RGB}{230,0,39}\def\thetacol#1{{\color{thetacolor}#1}}$ $\def\rank{\opcol{\rm rank}\,}$ $\def\kakko#1{\haiiro{\left(\kuro{#1}\right)}}\def\Kakko#1{\haiiro{\left[\kuro{#1}\right]}}\def\coldx{{\color{xcolor}\mathrm dx}}$ $\definecolor{ycolor}{RGB}{217,61,137}\def\ycol#1{{\color{ycolor}#1}}\def\haiiro#1{{\color{hai}#1}}\def\kuro#1{{\color{kuro}#1}}$ $\def\coldr{\rcol{\mathrm dr}}\def\coldvecx{\xcol{\mathrm d\vec x}}\def\intdx{\opcol{\int \mathrm dx}}\def\E{\mathrm e}\def\I{\mathrm i}\definecolor{opcol}{RGB}{149,139,0}\definecolor{hai}{RGB}{137,137,137}\definecolor{tcol}{RGB}{166,54,109}\definecolor{kuro}{RGB}{0,0,0}\definecolor{xcolor}{RGB}{169,103,49}$ $\def\opcol#1{{\color{opcol}#1}}\def\ddx{\opcol{{\mathrm d\over \mathrm dx}}}\def\ddt{\opcol{{\mathrm d\over \mathrm dt}}}\def\scol#1{\color{scolor}#1}$ $\def\ve{\vec{\mathbf e}}\def\colvecx{\xcol{\vec x}}\definecolor{usuopcolor}{RGB}{237,234,203}$ $\def\xcol#1{{\color{xcolor}#1}}$ $\def\gunderbrace{\underbrace}$ $\def\ovalbox{\boxed}\def\kesi#1{\underbrace{#1}_{0}}\newcommand\dum[2][xcolor]{{\color{#1}{\scriptstyle #2}}}\newcommand\dml[2][xcolor]{\,\haiiro{\!\lceil}{\!\color{#1}#2}}\newcommand\dmr[2][xcolor]{{\color{#1}#2}\!\haiiro{\rfloor}\!}}$ $\def\usuopcol#1{\color{usuopcolor}#1}\def\vgrad#1{{\usuopcol{\overrightarrow{\opcol{\rm grad}~\kuro{#1}}}}}\def\dX{\rcol{\mathrm dX}}\def\dY{\thetacol{\mathrm dY}}\def\opdf{\opcol{\mathrm df}}\def\coldf{\tcol{\mathrm df}}\def\dtwof{\opcol{\mathrm d^2f}}\def\murasakidb{\zcol{\mathrm d b}}\def\ao{\ycol}\def\aodV{\ycol{\diff V}}\def\aka{\xcol}\def\akadm{\xcol{\diff m}}$ $\def\psicol#1{{\color{psicolor}#1}}$ $\def\ope#1{\opcol{\hat{#1}}}$ $\def\diff{\mathrm d}\def\kidb{\opcol{\mathrm db}}\def\kidx{\opcol{\mathrm dx}}\def\coldy{\ycol{\mathrm dy}}$ $\def\Odr{{\cal O}}\definecolor{ncol}{RGB}{217,51,43}\def\ncol#1{{\color{ncol}#1}}\definecolor{zcolor}{RGB}{196,77,132}\def\zcol#1{{\color{zcolor}#1}}$ $\def\coldtheta{\thetacol{\mathrm d\theta}}\def\ddtheta{\opcol{{\mathrm d\over\mathrm d\theta}}}\def\tcol#1{{\color{tcol}#1}}\def\coldt{\tcol{\mathrm dt}}\def\kidtheta{\opcol{\mathrm d\theta}}\def\dtwodx{\opcol{\diff^2\over\diff x^2}}\def\kokode#1{~~~~~~~{↓#1}}\def\goverbrace{\overbrace}\def\coldz{\zcol{\mathrm dz}}\def\kidt{\opcol{\mathrm dt}}\definecolor{rcol}{RGB}{206,114,108}\def\rcol#1{{\color{rcol}#1}}\def\coldtwox{\xcol{\mathrm d^2x}}\def\PDC#1#2#3{{\opcol{\left(\opcol{{\partial \kuro{#1}\over \partial #2}}\right)}}_{#3}}\def\PDIC#1#2#3{{\opcol{\left(\opcol{\partial \over \partial #2}\kuro{#1}\right)}}_{#3}}\def\PD#1#2{{{\partial \kuro{#1}\over \partial #2}}}\def\PPDC#1#2#3{{\opcol{\left(\opcol{\partial^2 \kuro{#1}\over \partial #2^2}\right)}}_{#3}}\def\PPDD#1#2#3{{\opcol{{\partial^2 \kuro{#1}\over \partial #2\partial #3}}}}\def\PPD#1#2{{\opcol{{\partial^2 \kuro{#1}\over \partial #2^2}}}}\def\kidy{\opcol{\diff y}}$ $\def\tatevec#1{\boxed{#1}}\def\allc#1{\haiiro{\{}#1\haiiro{\}}}$ $\def\nagatatevec#1{\tatevec{\begin{array}{c}\\#1\\ \\\end{array}}}$ $\def\yokovec#1{\boxed{~~\left(#1\right)^t~~}}$ $\def\yokovecd#1{\boxed{~~\left(#1\right)^\dagger~~}}$ $\def\yokovectnashi#1{\boxed{#1}}$ $\def\nagayokovec#1{\boxed{~~~~~\left(#1\right)^t~~~~~}}$ $\def\nagayokovecd#1{\boxed{~~~~~\left(#1\right)^\dagger~~~~~}}$ $\def\sM{M}\def\sN{N}\definecolor{mxcolor}{RGB}{102,41,71}\def\mxcol#1{{\color{mxcolor}#1}}\newcommand{\mt}[1]{\mxcol{\bf #1}}\newcommand{\rv}[1]{\opcol{\left({\color{black}\begin{array}{@{\,}c@{\,}}#1\end{array}}\right)}}$ $\definecolor{phicolor}{RGB}{153,61,23}\definecolor{psicolor}{RGB}{229,69,115}$ $\def\phicol#1{{\color{phicolor}#1}}$ $\definecolor{rcolor}{RGB}{204,82,122}\definecolor{thetacolor}{RGB}{255,0,38}\definecolor{scolor}{RGB}{178,107,107}$ $\def\avec#1{\xcol{\mathbf #1}}$

「物理数学Ⅰ」2021年度講義録第15回

前回の感想・コメントシートから

 前回の授業の「感想・コメント」の欄に書かれたことと、それに対する返答は、

にありますので見ておいてください。

行列の微分

ビデオ↓
以下は文章による説明。

行列の微分の計算則

 行列の微分にも、

ライプニッツ則
\begin{equation} \ddt\left(\mt{A}\kakko{\tcol{t}}\mt{B}\kakko{\tcol{t}}\right) = \left(\ddt\mt{A}\kakko{\tcol{t}}\right)\mt{B}\kakko{\tcol{t}} + \mt{A}\kakko{\tcol{t}}\left(\ddt\mt{B}\kakko{\tcol{t}}\right) \end{equation}

が成立する。では実数関数の微分でおなじみの$\opcol{\diff \over \kidx}x^n = nx^{n-1}$に対応する、

$\ddt\left(\mt{A}\kakko{\tcol{t}}\right)^n= n \left(\ddt\mt{A}\kakko{\tcol{t}}\right)\left(\mt{A}\kakko{\tcol{t}}\right)^{n-1}$

は成立するかというと、

$\mt{A}\kakko{\tcol{t}}$と$\ddt\mt{A}\kakko{\tcol{t}}$が交換しないと成立しない。

 成立するのは \begin{align} \ddt\left(\mt{A}\kakko{\tcol{t}}\right)^n=& \left(\ddt\mt{A}\kakko{\tcol{t}}\right)\left(\mt{A}\kakko{\tcol{t}}\right)^{n-1} +\mt{A}\kakko{\tcol{t}} \left(\ddt\mt{A}\kakko{\tcol{t}}\right)\left(\mt{A}\kakko{\tcol{t}}\right)^{n-2} +\cdots\nonumber\\ & +\left(\mt{A}\kakko{\tcol{t}}\right)^{n-2}\left(\ddt\mt{A}\kakko{\tcol{t}}\right)\mt{A\kakko{\tcol{t}}} +\left(\mt{A}\kakko{\tcol{t}}\right)^{n-1}\left(\ddt\mt{A}\kakko{\tcol{t}}\right) \end{align} という(少々面倒な)式である。

逆行列の微分

 $\mt{A^{-1}}\kakko{\tcol{t}}\mt{A}\kakko{\tcol{t}}=\mt{I}$の両辺を微分すると(右辺は定数だから微分すると0)、 \begin{align} \left( \ddt \mt{A^{-1}}\kakko{\tcol{t}} \right) \mt{A}\kakko{\tcol{t}} +\mt{A^{-1}}\kakko{\tcol{t}}\left(\ddt \mt{A}\kakko{\tcol{t}}\right)=&0\nonumber\\ \left( \ddt \mt{A^{-1}}\kakko{\tcol{t}} \right) \mt{A}\kakko{\tcol{t}} =&-\mt{A^{-1}}\kakko{\tcol{t}}\left(\ddt \mt{A}\kakko{\tcol{t}}\right)\nonumber\\ \ddt \mt{A^{-1}}\kakko{\tcol{t}} =&-\mt{A^{-1}}\kakko{\tcol{t}}\left(\ddt \mt{A}\kakko{\tcol{t}}\right)\mt{A^{-1}}\kakko{\tcol{t}} \end{align} を得る。すなわち、逆行列の微分は元の行列の微分の前後に逆行列を掛けて、さらにマイナス符号をつける。この式を$1\times1$行列で考えれば分数関数の微分 \begin{equation} \ddt\left({1\over f\kakko{\tcol{t}}}\right)=-{f'\kakko{\tcol{t}}\over \left(f\kakko{\tcol{t}}\right)^2} \end{equation} の式になる(数なら${1\over f\kakko{\tcol{t}}}$の位置を変えてもいいが、行列である$\mt{A^{-1}}$はそうはいかないことに注意しよう。

行列式の微分

 行列が$\xcol{x}$の関数である場合、行列式もまた$\xcol{x}$の関数となる。これを微分するとまず余因子の式$\tilde A_{pq}={\partial \left(\det~\mt{A}\right)\over \partial {A_{qp}}}$から、 \begin{align} {\partial\over \partial x}\det\mt{A}\kakko{\xcol{x}} =\sum_{\dum{p},\dum[ycolor]{q}}\tilde A_{\dml{p}\dml[ycolor]{q}}\kakko{\xcol{x}}{\partial A_{\dmr[ycolor]{q}\dmr{p}}\kakko{\xcol{x}}\over \partial x} =\det\mt{A}\kakko{\xcol{x}}\sum_{\dum{p},\dum[ycolor]{q}}(\mt{A^{-1}})_{\dml{p}\dml[ycolor]{q}}\kakko{\xcol{x}}{\partial A_{\dmr[ycolor]{q}\dmr{p}}\kakko{\xcol{x}}\over \partial x} \end{align} という式を作ることができる(余因子と逆行列の関係$\mt{A^{-1}}={1\over \det\mt{A}}\mt{\tilde A}$を使った)。また、行列式を$\det\kakko{\vec v_1,\vec v_2,\cdots,\vec v_\sN}$と表現した場合、その微分は \begin{align} & \opcol{\diff \over \kidx}\det\kakko{\vec v_1,\vec v_2,\cdots,\vec v_\sN} \nonumber\\ =& \det\kakko{\opcol{\diff \kuro{\vec v_1}\over \kidx},\vec v_2,\cdots,\vec v_\sN} +\det\kakko{\vec v_1,\opcol{\diff \kuro{\vec v_2}\over \kidx},\cdots,\vec v_\sN} +\cdots+\det\kakko{\vec v_1,\vec v_2,\cdots,\opcol{\diff \kuro{\vec v_\sN}\over \kidx}} \end{align} のように「列ごとの微分」を足しあげることで計算できる(行ごとにしても可)。

行列の指数関数

行列の指数関数

 以下の話の説明ビデオは↓

指数関数$\exp\kakko{\xcol{x}}$は \begin{align} \exp\kakko{\xcol{x}}=\sum_{n=0}^\infty {1\over n!}\xcol{x}^n \end{align} とテイラー展開することができた。これの真似をして、行列の指数関数を \begin{align} \exp\kakko{\mt{X}}=\sum_{n=0}^\infty {1\over n!}\mt{X}^n \end{align} で定義しよう。行列の指数関数は何の役に立つかというと、通常の指数関数が

微分方程式$\ope{\diff\over \kidx}f\kakko{\xcol{x}}=af\kakko{\xcol{x}}$の解は$f\kakko{\xcol{x}}=C\exp\kakko{a\xcol{x}}$←印刷テキスト、ここの$a$が抜けてます。(ただし、$C$は$\xcol{x}=0$での$f$の値$f\kakko{0}$)。

であったのと同様に、

 微分方程式$\ope{\diff\over \kidx}\vec f\kakko{\xcol{x}}=\mt{A}\vec f\kakko{\xcol{x}}$の解は$\vec f\kakko{\xcol{x}}=\exp\kakko{\mt{A}\xcol{x}}\vec C$(ただし、$\vec C$は$\xcol{x}=0$での$\vec f$の値$\vec f\kakko{0}$)。

が成り立つのである。

微分方程式の解が$\vec f\kakko{\xcol{x}}=\exp\kakko{\mt{A}\xcol{x}}\vec C$になると上で述べたが、固有ベクトル$\vec v_{\fromL\lambda}$に対してはこの方程式が \begin{align} \vec v_{\fromL\lambda}\kakko{\xcol{x}}=\exp\kakko{\lambda\xcol{x}}\vec v_{\fromL\lambda}\kakko{0} \end{align} となる。つまり固有値が正のベクトルは指数関数的に増大する一方、固有値が負のベクトルは指数関数的に減少し0に向かう。行列の固有値で関数がどのように振る舞うかがある程度決まる。

指数関数を計算する方法:対角化可能な行列

 行列の指数関数を$\exp\kakko{\mt{X}}=\sum_{n=0}^\infty {1\over n!}\mt{X}^n$で定義するとは言っても、これが計算不可能(級数が収束しないなど)であったら意味がない。計算するためには、対角化を使う。行列$\mt{P}$を使って$\mt{P^{-1}XP}$が対角行列$\mtx[ccc]{\lambda_1&0&\cdots\\0&\lambda_2&\cdots\\\vdots&\vdots&\ddots}$になったとする。この対角行列の$\exp$を考えると、 \begin{align} \exp\kakko{\mt{P^{-1}XP}}=&\sum_{n=0}^\infty {1\over n!}\left( \mt{P^{-1}XP}\right)^n\nonumber\\ \exp{\mtx[ccc]{\lambda_1&0&\cdots\\0&\lambda_2&\cdots\\\vdots&\vdots&\ddots}}=&\sum_{n=0}^\infty {1\over n!}\goverbrace{ \mt{P^{-1}X}\gunderbrace{\mt{PP^{-1}}}_{\mt{I}}\mt{XP}\cdots\mt{P^{-1}XP}}^{n個} \nonumber\\ {\mtx[ccc]{\exp\kakko{\lambda_1}&0&\cdots\\0&\exp\kakko{\lambda_2}&\cdots\\\vdots&\vdots&\ddots}}=&\mt{P^{-1}}\gunderbrace{\sum_{n=0}^\infty {1\over n!}\left(\mt{X}\right)^n}_{\exp\kakko{\mt{X}}} \mt{P} \nonumber\\ \mt{P}{\mtx[ccc]{\exp\kakko{\lambda_1}&0&\cdots\\0&\exp\kakko{\lambda_2}&\cdots\\\vdots&\vdots&\ddots}}\mt{P^{-1}}=&{\exp\kakko{\mt{X}}} \end{align} となることから、$\exp\kakko{\mt{X}}$が計算できる。指数関数は収束半径が$\infty$なので、「級数が収束するか」という心配は不要である。

【練習問題】 行列$\mtx{0&\theta\\\theta &0},~~~\mtx{0&-\theta\\\theta &0}$の$\exp$を計算せよ。
ここに回答があるので、やってみてから開くこと。 偶数べきと奇数べきにわけて計算するとよい。 \begin{align} \exp\mtx{0&\theta\\\theta &0} =&\sum_{n=0}^\infty {1\over n!}\theta^n \mtxn{0&1\\1&0}{n} \nonumber\\ =& \sum_{n=0}^\infty {1\over (2n)!}\theta^{2n} \mtx{1&0\\0&1} +\sum_{n=0}^\infty {1\over (2n+1)!}\theta^{2n+1} \mtx{0&1\\1&0}\nonumber\\ =&\mtx{\cosh \theta&\sinh \theta\\ \sinh \theta&\cosh \theta} \end{align} \begin{align} \exp\mtx{0&-\theta\\\theta &0} =&\sum_{n=0}^\infty {1\over n!}\theta^n \mtxn{0&-1\\1&0}{n} \nonumber\\ =& \sum_{n=0}^\infty {(-1)^n\over (2n)!}\theta^{2n} \mtx{1&0\\0&1} +\sum_{n=0}^\infty {(-1)^n \over (2n+1)!}\theta^{2n+1} \mtx{0&-1\\1&0}\nonumber\\ =&\mtx{\cos \theta&-\sin \theta\\ \sin \theta&\cos \theta} \end{align}
前回の感想・コメントシートから 指数関数を計算する方法:対角化できない行列

指数関数を計算する方法:対角化できない行列

 以下は対角化できない行列の指数関数の計算方法である。物理をやっていて使うことはそう多くはないので、説明を載せておくが、興味のある人だけ読んでおくこと(ビデオはつけてない)。

 対角化できない場合もJordan標準形に持っていくと$\exp$が計算できる。Jordan細胞の一つである$\mtx{a&1\\0&a}$に変数$\tcol{t}$を掛けた行列の指数関数を計算してみる。まず行列の$n$乗を計算しよう。 \begin{align} \mtxn{a&1\\0&a}{2}=\mtx{a^2&2a\\0&a^2}, \mtxn{a&1\\0&a}{3}=\mtx{a^3&3a^2\\0&a^3},\cdots \end{align} となるので、\begin{align} \mtxn{a&1\\0&a}{n}=\mtx{a^n&na^{n-1}\\0&a^n} \end{align} と予想できる。\begin{align} \mtxn{a&1\\0&a}{n+1}=\mtx{a^n&na^{n-1}\\0&a^n}\mtx{a&1\\0&a}=\mtx{a^{n+1}&(n+1)a^n\\ 0&a^{n+1}} \end{align} と確認できるので、0以上の整数$n$についてこの予想は正しい。

 ということは、 \begin{align} \exp\kakko{\tcol{t}\mtx{a&1\\0&a}}=\sum_{n=0}^\infty {{\tcol{t}^n}\over n!}\mtx{a^{n}&na^{n-1}\\ 0&a^{n}} =\mtx{\E^{a\tcol{t}} &\tcol{t}\E^{a\tcol{t}}\\ 0&\E^{a\tcol{t}}} \end{align} となる。対角成分が$\sum_{n=0}^\infty{1\over n!}\left(a\tcol{t}\right)^n=e^{a\tcol{t}}$なのはすぐにわかる。右上成分についても、 \begin{align} \sum_{n=0}^\infty {\tcol{t}^n\over n!}na^{n-1} = \tcol{t}\sum_{n=1}^\infty {1\over (n-1)!}(a\tcol{t})^{n-1} \end{align} となって、$n\to n+1$とずらせばこの式は$\tcol{t}$に$\E^{a\tcol{t}}$を掛けた式になる。これで、相似変換して$\mt{J_2}$になる行列の指数関数も計算できるようになった。

行列$\mt{M}$を相似変換してジョルダン標準形に持っていったのち、 \begin{align} &\goverbrace{\mtx[c@{\,}c@{\,}c|c@{\,}c@{\,}c@{\,}c]{ \mt{J_{\it m_{1,1}}}\kakko{\lambda_1}&&&&&&\\[2mm] &\ddots&&&&&\\ &&\mt{J_{\it m_{1,c_1}}}\kakko{\lambda_1}&&\\[2mm]\hline &&&\mt{J_{\it m_2,1}}\kakko{\lambda_2}&\\ &&&&\ddots\\ }}^{\mt{P^{-1}MP}}\nonumber\\ =& \gunderbrace{\mtx[c@{}c@{}c|c@{}c@{}c@{}c]{ \lambda_1\mt{I}&&&&&&\\[2mm] &\ddots&&&&&\\ &&\lambda_1\mt{I}&&\\[2mm]\hline &&&\lambda_2\mt{I}&\\ &&&&\ddots\\ }}_{\mt{P^{-1}SP}} + \gunderbrace{\mtx[c@{}c@{}c|c@{}c@{}c@{}c]{ \mt{J_{\it m_{1,1}}}\kakko{\lambda_1}-\lambda_1\mt{I}&&&&&&\\[2mm] &\ddots&&&&&\\ &&\mt{J_{\it m_{1,c_1}}}\kakko{\lambda_1}-\lambda_1\mt{I}&&\\[2mm]\hline &&&\mt{J_{\it m_2,1}}\kakko{\lambda_2}-\lambda_2\mt{I}&\\ &&&&\ddots\\ }}_{\mt{P^{-1}NP}} \end{align} のように分解する。最後の式の第2項と第2項を$\mt{P^{-1}SP}$と$\mt{P^{-1}NP}$とした($\mt{P^{-1}NP}$はジョルダン細胞のうち対角成分を抜いたものなので、対角成分の一つ上に1が並ぶという形の行列)が、この二つの行列は交換するので、これを逆相似変換した$\mt{S}$と$\mt{N}$も交換する。よって、 \begin{align} \exp\mt{M}=\exp\mt{S}\exp\mt{N} \end{align} として計算するという手法($\mt{S}+\mt{N}$分解)もある。$\mt{N}$は($\mt{P^{-1}NP}$がそうなので)「べき零行列」(何乗かすると$\mt{0}$になる行列)であるため、$\exp\mt{N}$は有限項で終わるというありがたさがある。
行列の指数関数 行列の対数関数

行列の対数関数

 以下の話の説明ビデオは↓

対数関数の定義

 対数関数には \begin{align} \log\kakko{\xcol{x}}=&\log c -\sum_{n=1}^\infty {(-1)^n\over n}\left({\xcol{x}-c\over c}\right)^n\nonumber\\ =&\log c +\left({\xcol{x}-c\over c}\right)-{1\over 2}\left({\xcol{x}-c\over c}\right)^2+{1\over 3}\left({\xcol{x}-c\over c}\right)^3+\cdots \end{align} というテイラー展開がある。$c$は定数である(どのような条件を満たすべきかは後で決める)。この式の右辺を微分すると、\begin{align} -\sum_{n=1}^\infty (-1)^n {1\over c}\left({\xcol{x}-c\over c}\right)^{n-1}={1\over c} -{1\over c}\left({\xcol{x}-c\over c}\right) +{1\over c}\left({\xcol{x}-c\over c}\right)^2+\cdots \end{align} となるが、左辺は初項が${1\over c}$で公比が$-{\xcol{x}-c\over c}$の等比級数なので、その和は\begin{align} {{1\over c}\over 1-{c-\xcol{x}\over c}}={1\over c-c+\xcol{x}}={1\over \xcol{x}} \end{align} となる。この式が正しい(級数が収束する)ためには、$\left|{c-\xcol{x}\over c}\right|< 1$でなくてはいけない。この不等式は$-1< {\xcol{x}-c\over c}< 1$となるので、「$c>0$なら、$-c< \xcol{x}-c< c$すなわち$0< \xcol{x}< 2c$」または「$c< 0$なら、$-c>\xcol{x}-c>c$すなわち$2c< \xcol{x}< 0$」という意味になる。$\xcol{x}=0$は$\log\xcol{x}$が定義されていない場所なので、その場所を超えてテイラー展開はできないので、$c$と$\xcol{x}$は同符号でなくてはいけない。

 これの真似をして、以下のように定義しよう。

行列の対数関数

\begin{align} \log\kakko{\mt{X}}=&\log c \mt{I} -\sum_{n=1}^\infty {(-1)^n\over n }\left({\mt{X}-c\mt{I}\over c}\right)^n\nonumber\\ =&\log c\mt{I}+{\mt{X}-c\mt{I}\over c}-{1\over 2}\left({\mt{X}-c\mt{I}\over c}\right)^2+{1\over 3}\left({\mt{X}-c\mt{I}\over c}\right)^3+\cdots\label{matlog} \end{align}

 この定義による対数関数は期待される通り、$\exp\kakko{\log\kakko{\mt{X}}}=\mt{X}$と$\log\kakko{\exp\kakko{\mt{X}}}=\mt{X}$を満たすであろうか?---$\mt{X}$が対角化可能な場合をまず考えよう。 \begin{align} \mt{P^{-1}} \log\kakko{\mt{X}}\mt{P} =& \log c \mt{P^{-1}I\mt{P}} -\sum_{n=1}^\infty {(-1)^n\over n c^n}\left( \mt{P^{-1}}\left(\mt{X}-c\mt{I}\right)\mt{P} \right)^n \nonumber\\ =& \log c \mt{I} -\sum_{n=1}^\infty {(-1)^n\over n c^n}\left( \mt{P^{-1}XP}-c\mt{I} \right)^n \nonumber\\ =&\mtx[ccc]{\log c&0&\cdots\\0&\log c \cdots\\\vdots&\vdots&\ddots} -\sum_{n=1}^\infty{(-1)^n\over nc^n}\mtxn[ccc]{\lambda_1-c&0&\cdots\\0&{\lambda_2-c} \cdots\\\vdots&\vdots&\ddots}{n} \nonumber\\ =&\mtx[ccc]{\log \lambda_1&0&\cdots\\0&\log \lambda_2& \cdots\\\vdots&\vdots&\ddots} \end{align} となるから、\begin{align} \underbrace{\exp\kakko{\mt{P^{-1}}\log\kakko{\mt{X}}\mt{P}}}_{\mt{P^{-1}\exp\kakko{\log\kakko{\mt{X}}}}\mt{P}} = \exp\mtx[ccc]{\log \lambda_1&0&\cdots\\0&\log \lambda_2& \cdots\\\vdots&\vdots&\ddots}= \gunderbrace{ \mtx[ccc]{\lambda_1&0&\cdots\\0&\lambda_2& \cdots\\\vdots&\vdots&\ddots}}_{\mt{P^{-1}XP}} \end{align} となって、$\exp\kakko{\log\kakko{\mt{X}}}=\mt{X}$が結論できる。

 ただし、ここで固有値の中に0があると$\log\lambda$が計算できない。よってこの式が成立するのは$\mt{X}$が正則なときだけである(実数の対数関数だって、「$\log\kakko{0}$を計算しろ」と言われても無理なので仕方ない)。

【練習問題】$\mt{X}$が対角化可能な行列の場合で、 $\log\kakko{\exp\kakko{\mt{X}}}=\mt{X}$を示せ。
解答略。すぐにできるのでやってみて。わからない場合は印刷テキストまたはPDFを見てください。
指数関数を計算する方法:対角化できない行列 行列の指数関数に関する公式

行列の指数関数に関する公式

 以下の話の説明ビデオは↓

 行列の指数関数を使う公式についてまとめておく。

行列の指数関数の$\det$

$\det\kakko{\exp\mt{M}}$と$\log\kakko{\det\mt{M}}$
\begin{align} \det\kakko{\exp\mt{M}}=&\exp\kakko{\tr\mt{M}}\label{detexp}\\ \log\kakko{\det\mt{M}}=&\tr\kakko{\log\mt{M}}\label{trlog} \end{align}

 証明は相似変換による三角行列化を使う。\begin{align} \det\kakko{\exp\mt{M}}= \det\kakko{\mt{P^{-1}}\left(\exp\mt{M}\right)\mt{P}}=\det\kakko{\exp\kakko{\mt{P^{-1}}\mt{M}\mt{P}}} \end{align} として、$\mt{P^{-1}}\mt{M}\mt{P}$が三角行列化されていれば、$\mt{P^{-1}MP}$の対角成分には固有値$\lambda_1,\lambda_2,\cdots$が並ぶので、$\exp\kakko{\mt{P^{-1}MP}}$の対角成分には$\E^{\lambda_1},\E^{\lambda_2},\cdots$が並ぶことになる。三角行列の行列式は対角成分の積なので、\begin{align} \det\kakko{\exp\kakko{\mt{P^{-1}}\mt{M}\mt{P}}}=\E^{\lambda_1}\E^{\lambda_2}\cdots=\E^{\lambda_1+\lambda_2+\cdots} \end{align} となる。固有値の和はトレースだから、$\det\kakko{\exp\mt{P^{-1}MP}}=\exp\kakko{\tr\mt{P^{-1}MP}}$がわかる。相似変換は行列式もトレースも変えないから、これで証明できた。

 このことから$\mt{M}$がどんな行列であっても$\exp\mt{M}$は正則行列であることがわかる。

 下の式の方は、$\mt{M}\to \log\mt{M}$と置き換えればすぐに出る。

$\exp\kakko{-\mt{A}}$による相似変換

$\exp\kakko{-\mt{A}}$による相似変換
\begin{align} \exp\kakko{{\mt{A}}}\mt{B}\exp\kakko{-\mt{A}} =\mt{B} +\left[\mt{A},\mt{B}\right] +{1\over 2}\left[\mt{A},\left[\mt{A},\mt{B}\right]\right] +{1\over 3!}\left[\mt{A}, \left[\mt{A},\left[\mt{A},\mt{B}\right]\right]\right]+\cdots \end{align}

を証明しよう(ここで$\mt{P}=\exp\kakko{-\mt{A}},\mt{P^{-1}}=\exp\kakko{\mt{A}}$としている。$\exp\kakko{-\mt{A}}$の逆行列は$\exp\kakko{-\mt{A^{-1}}}$ではなく、$\exp\kakko{\mt{A}}$である)。この式は \begin{align} \exp\left({\mt{A}\tcol{t}}\right)\mt{B}\exp\left(-\mt{A}\tcol{t}\right) =\mt{B} +\tcol{t}\left[\mt{A},\mt{B}\right] +{\tcol{t}^2\over 2}\left[\mt{A},\left[\mt{A},\mt{B}\right]\right] +{\tcol{t}^3\over 3!}\left[\mt{A}, \left[\mt{A},\left[\mt{A},\mt{B}\right]\right]\right]+\cdots\label{BHt} \end{align} の$\tcol{t}=1$とした式なのだが、この式の右辺を$\tcol{t}$によるテイラー展開と解釈すれば\begin{align} \left(\opcol{\diff\over \kidt} \right)^n \left( \exp\kakko{ {\mt{A}\tcol{t}}}\mt{B}\exp\kakko{-\mt{A}\tcol{t}}\right)\bigg|_{\tcol{t}=0} =\goverbrace{ \bigl[\mt{A},\bigl[\mt{A},\bigl[\mt{A},\cdots,\bigl[\mt{A},}^{n回の繰り返し} \mt{B}\bigr]\bigr]\bigr]\bigr] \end{align} が示せればこの等式が示せたことになる。$n=0$は$\exp\kakko{\mt{A}\tcol{t}}\mt{B}\exp\kakko{-\mt{A}\tcol{t}}\bigg|_{\tcol{t}=0}=\mt{B}$となって、自明である。$n=1$をまず示そう。 \begin{align} &\opcol{\diff\over \kidt} \bigl( \exp\kakko{{\mt{A}\tcol{t}}}\mt{B}\exp\kakko{-\mt{A}\tcol{t}}\bigr)\bigg|_{\tcol{t}=0} \nonumber\\ =&\bigl( \goverbrace{\exp\left({\mt{A}\tcol{t}}\right)\mt{A}}^{\opcol{\diff \over \kidt}\left(\exp\left(\mt{A}\tcol{t}\right)\right)}\mt{B}\exp\left(-\mt{A}\tcol{t}\right) +\exp\left({\mt{A}\tcol{t}}\right)\mt{B}\goverbrace{\left(-\mt{A}\exp\left(-\mt{A}\tcol{t}\right)\right)}^{\ope{\diff \over \kidt}\left(\exp\left(-\mt{A}\tcol{t}\right)\right)} \bigr)\bigg|_{\tcol{t}=0} \nonumber\\ =& \exp\left({\mt{A}\tcol{t}}\right) \left( \mt{A}\mt{B} -\mt{B}\mt{A} \right) \exp\left(-\mt{A}\tcol{t}\right) \end{align} 上で$\ope{\diff \over \kidt}\left(\exp\left(\mt{A}\tcol{t}\right)\right)=\exp\left({\mt{A}\tcol{t}}\right)\mt{A}$としているが、この微分により$\mt{A}$はこのように後ろに出ても、$\ope{\diff \over \kidt}\left(\exp\left(\mt{A}\tcol{t}\right)\right)=\mt{A}\exp\left({\mt{A}\tcol{t}}\right)$のように前に出てもよい($\mt{A}$と$\exp\left(\mt{A}\tcol{t}\right)$は可換である)。

 以上を繰り返していくと、微分をするたびに交換関係$\left[\mt{A},*\right]$の数が増えていくことがわかる。よって\begin{align} \exp\kakko{{\mt{A}\tcol{t}}}\mt{B}\exp\kakko{-\mt{A}\tcol{t}}= \sum_{n=0}^\infty {\tcol{t}^n\over n!}\goverbrace{ \bigl[\mt{A},\bigl[\mt{A},\bigl[\mt{A},\cdots,\bigl[\mt{A},}^{n回の繰り返し} \mt{B}\bigr]\bigr]\bigr]\bigr] \end{align} がわかった。この式を、\begin{align} \exp\kakko{{\mt{A}\tcol{t}}}\mt{B}\exp\kakko{-\mt{A}\tcol{t}}=\exp\kakko{\tcol{t}\left[\mt{A},*\right]}\mt{B} \end{align} と略記する。

行列の対数関数 Campbell-Baker-Hausdolffの公式

Campbell-Baker-Hausdolffの公式

 以下の話の説明ビデオは↓

 実数または複素数の指数関数については$\E^\xcol{x}\E^\ycol{y}=\E^{\xcol{x}+\ycol{y}}$であるが、行列については以下のような式が知られている。

Campbell-Baker-Hausdolffの公式
\begin{align} \exp\mt{A}\exp\mt{B}=\exp\kakko{\mt{A}+\mt{B}+{1\over 2}\left[\mt{A},\mt{B}\right] +{1\over 12}\left( \left[\mt{A},\left[\mt{A},\mt{B}\right]\right] +\left[\left[\mt{A},\mt{B}\right],\mt{B}\right]\right) +\cdots }\label{BH} \end{align}
 この式は、\begin{align} \log\kakko{\exp\mt{A}\exp\mt{B}}=\mt{A}+\mt{B}+{1\over 2}\left[\mt{A},\mt{B}\right] +{1\over 12}\left( \left[\mt{A},\left[\mt{A},\mt{B}\right]\right] +\left[\left[\mt{A},\mt{B}\right],\mt{B}\right]\right) +\cdots \end{align} と書き直すことができて、これは行列の指数関数と対数関数の定義から順に計算していくことができる。

 $c=1$にした場合の式を使って、\begin{align} \log\kakko{\exp{\mt{A}}\exp\mt{B}}=& \exp\mt{A}\exp\mt{B}-\mt{I}-{1\over 2}\left(\exp\mt{A}\exp\mt{B}-\mt{I}\right)^2 +{1\over 3}\left(\exp\mt{A}\exp\mt{B}-\mt{I}\right)^3+\cdots \end{align} となるが、\begin{align} \exp\mt{A}\exp{\mt{B}}-\mt{I} =& \left(\mt{I}+\mt{A}+{1\over 2}\mt{A^2}+{1\over 3!}\mt{A^3}+\cdots\right) \left(\mt{I}+\mt{B}+{1\over 2}\mt{B^2}+{1\over 3!}\mt{B^3}+\cdots\right)-\mt{I}\nonumber\\ =&\goverbrace{\mt{A}+\mt{B}}^{1次の項}+\goverbrace{{1\over 2}\mt{A^2}+\mt{A}\mt{B}+{1\over 2}\mt{B^2}}^{2次の項} +\goverbrace{{1\over 3!}\mt{A^3} +{1\over 2}\mt{A^2B} +{1\over 2}\mt{AB^2} +{1\over 3!}\mt{B^3}}^{3次の項}+\cdots \end{align} であるから、\begin{align} 1次の項:&\mt{A}+\mt{B}\\ 2次の項:&{1\over 2}\mt{A^2}+\mt{A}\mt{B}+{1\over 2}\mt{B^2}-{1\over 2}\left(\mt{A}+\mt{B}\right)^2={1\over 2}\left[\mt{A},\mt{B}\right] \end{align} のように順に計算していくことができる。3次の項まで計算しておくと、\begin{align} =& {1\over 3!}\mt{A^3} +{1\over 2}\mt{A^2B} +{1\over 2}\mt{AB^2} +{1\over 3!}\mt{B^3}\nonumber\\ &-{1\over 2}(\mt{A}+\mt{B})\left({1\over 2}\mt{A^2}+\mt{A}\mt{B}+{1\over 2}\mt{B^2}\right) -{1\over 2}\left({1\over 2}\mt{A^2}+\mt{A}\mt{B}+{1\over 2}\mt{B^2}\right)(\mt{A}+\mt{B}) \nonumber\\ &+{1\over 3}\left( \mt{A^3}+\mt{A^2B}+\mt{ABA}+\mt{BA^2} +\mt{AB^2}+\mt{BAB}+\mt{B^2A}+\mt{B^3} \right) \nonumber\\ =& \left({1\over 2}-{1\over 2}-{1\over 4}+{1\over 3}\right)\mt{A^2B} +\left(-{1\over 2}+{1\over 3}\right)\mt{ABA} +\left(-{1\over 4}+{1\over 3}\right)\mt{BA^2}\nonumber\\ &+\left({1\over 2}-{1\over 4}-{1\over 2}+{1\over 3}\right)\mt{AB^2} +\left(-{1\over 2}+{1\over 3}\right)\mt{BAB} +\left(-{1\over 4}+{1\over 3}\right)\mt{B^2A} \nonumber\\ =& {1\over 12}\mt{A^2B} -{1\over 6}\mt{ABA} +{1\over 12}\mt{BA^2}+{1\over 12}\mt{AB^2} -{1\over 6}\mt{BAB} +{1\over 12}\mt{B^2A} \nonumber\\ =&{1\over 12}\mt{A}\left[\mt{A},\mt{B}\right] -{1\over 12}\left[\mt{A},\mt{B}\right]\mt{A} +{1\over 12}\left[\mt{A},\mt{B}\right]\mt{B} -{1\over 12}\mt{B}\left[\mt{A},\mt{B}\right] \nonumber\\ =& {1\over 12}\left[\mt{A},\left[\mt{A},\mt{B}\right]\right] +{1\over 12}\left[\left[\mt{A},\mt{B}\right],\mt{B}\right] \end{align} のようになる。ここから先も、交換関係の形にまとまっていく。

行列の指数関数に関する公式 これにて講義終了&試験について

これにて講義終了&試験の中止について

 試験を行う予定でしたが、コロナの状況が悪くて不安だという声がありましたので、最終レポートの提出に変えます。最終レポートの課題は、webClassにあがっています。

締め切りは8月14日の23:59です。遅れての提出は認めませんので注意してください。

 以上で第15回の授業は終わりです。webClassに行って、アンケートに答えてください。

物理数学I webclass

この感想・コメントシートに書かれたことについては、代表的なものに対しては次のページで返答します。

 なお、webClassに情報を載せていますが、木と金の11:50〜12:50の間、オンラインオフィスアワーとしてzoomを開いてます。

 質問や相談などがある人は来て話してください。参加者が少ないので、物理系1年生向けのオフィスアワーと合同になってます。

テキストのPDF版はこちらです。
テキストの印刷冊子がありますので、前野の部屋(A307)まで取りに来てください。
Campbell-Baker-Hausdolffの公式 受講者の感想・コメント

受講者の感想・コメント

微分や指数や対数が出てきて驚いた。行列ってすごいなと思った。
行列を微分したり指数や対数をとらなくてはいけない状況というのが、これから出てくると思います。
行列の指数関数や対数関数は想像してなかったので面白かった
後で役に立ちます。
微分の具体的な計算とexpの練習問題の途中計算で少しわからないところがあったので、自分でも調べてみようと思います。全15回の講義ありがとうございました。期末も頑張ろうと思います。
やってみてください。書いてあるとおりの計算でいけるはずです。
行列の場合の微分やexp,logは行列の性質などが絡んでくるので全体的に煩雑で分かりずらいように感じるが、それでも実際に計算していくと意外ときれいな形になっていくのは面白いなと感じた。こういった計算をスムーズに行っていくためにも改めて各々の性質のもう一度確認していかなければいけないなと思った。
複雑といえば複雑ですが、これから物理を勉強していくうえでは大事な「道具」になります。
今日の授業では行列の微分や行列の指数関数や対数関数などについて学びました。微分や公式を証明していく過程で実数関数なら成り立っていたことが行列では成り立たない事があるのを理解し気をつけていきたいと思いました。また、計算などで(説明などの計算とかでも)うまくいかない所や説明を聞いて(見て)、(前の授業でやった所を忘れているなどもあって)理解が曖昧だと思った所もあったのでしっかり復習して理解を深め計算もできるようにしたいと思いました。
計算してみて、理解しておいてください。
これにて講義終了&試験について