よくある誤り
常微分の時に${\mathrm dz\over \mathrm dy}{\mathrm dy\over \mathrm dx}={\mathrm dz\over \mathrm dx}$ができたのだから偏微分でも${\partial {z}\over \partial y}{\partial {y}\over \partial x}={\partial {z}\over \partial x}$だろう。
省略記法で書いているせいで「これでいい」と勘違いしてしまうことがある。誤解がないよう省略なしで書けば、常微分の${\mathrm dz\over \mathrm dy}{\mathrm dy\over \mathrm dx}={\mathrm dz\over \mathrm dx}$は${\mathrm dz({y})\over \mathrm dy}{\mathrm dy({x})\over \mathrm dx}={\mathrm dz(y({x}))\over \mathrm dx}$である一方、偏微分の${\partial {z}\over \partial y}{\partial {y}\over \partial x}\neq{\partial {z}\over \partial x}$(等式ではないことに注意)は $$ \left({\partial {z({x},{y})}\over \partial y}\right)_{{x}}\left({\partial {y({z},{x})}\over \partial x}\right)_{{z}}\neq\left({\partial {z({x},{y})}\over \partial x}\right)_{{z}} $$ であり、本質的に違う計算である。常微分の方では三つの変数は「${x}$が決まると${y}$が決まり、次に${z}$が決まる」という関係であり、自由度は1しかない。つまり3変数の3次元空間の中である1次元的広がり(曲線)の上でしか運動できない。一方偏微分の方は「${x}$と${y}$が決まると${z}$が決まる(あるいはこの立場入れ替え)」という関係だから自由度2で、2次元的広がり(曲面)の上を動ける(だから偏微分は方向の指定が必要になるわけだ)。
例として、${x}^2+{y}^2+{z}^2=R^2$が成り立つ、すなわち3次元の中の球面(2次元的広がり)の上に$({x},{y},{z})$がある)場合を考えよう。この場合${z}=\pm\sqrt{R^2-{x}^2-{y}^2}$とか${y}=\pm\sqrt{R^2-{x}^2-{z}^2}$のような関係式がある。複号があると考えるのが面倒なので、考える範囲を${x},{y},{z}$が全て正である領域に限ろう(複号は全て正をとる)。微分を実行すると、 \begin{equation} \left({\partial {z({x},{y})}\over \partial y}\right)_{{x}} =- {{y}\over \sqrt{R^2-{x}^2-{y}^2}},~~~~ \left({\partial {y({x},{z})}\over \partial x}\right)_{{z}} =- {{x}\over \sqrt{R^2-{x}^2-{z}^2}} \end{equation} である。この二つの掛算をし、$\sqrt{R^2-{x}^2-{z}^2}={y}$であることを使うと、 \begin{equation} \left({\partial {z({x},{y})}\over \partial y}\right)_{{x}} \left({\partial {y({x},{z})}\over \partial x}\right)_{{z}} ={{y}\over \sqrt{R^2-{x}^2-{y}^2}}\times{{x}\over \sqrt{R^2-{x}^2-{z}^2}} ={{x} \over \sqrt{R^2-{x}^2-{y}^2}} \end{equation} となる。一方、 \begin{equation} \left({\partial {z({x},{y})}\over \partial x}\right)_{{y}} =- {{x}\over \sqrt{R^2-{x}^2-{y}^2}} \end{equation} だから、この二つの式から \begin{equation} \left({\partial {z({x},{y})}\over \partial y}\right)_{{x}} \left({\partial {y({x},{z})}\over \partial x}\right)_{{z}} = - \left({\partial {z({x},{y})}\over \partial x}\right)_{{y}}\label{henbibunminus} \end{equation} という関係になっている(右辺のマイナス符号に注意!)。
${x},{y},{z}$の間に適当な関係式(なんでもよい)を作り、その場合の$\left({\partial {z({x},{y})}\over \partial y}\right)_{{x}}\left({\partial {y({x},{z})}\over \partial x}\right)_{{z}} = - \left({\partial {z({x},{y})}\over \partial x}\right)_{{y}}$の両辺を別個に計算し、成立することを確認してみよう。
この式は$z({x},{y})$などが微分可能である限り正しいことを以下で、二通りの方法で示そう。
${x},{y},{z}$という3次元の空間を考えて、ある関係式(上の例では${x}^2+{y}^2+{z}^2=R^2$であった)があることによりこのうち二つが独立であったとする。関係があるのだから、三つの変数のうち一つを他の二つで表すことができる。そこで \begin{equation} {x}=X({y},{z}),~ {y}=Y({x},{z}),~ {z}=Z({x},{y}) \end{equation} という三つの式を作ることができたものとしよう。第3の式に第2の式を代入すると、 \begin{equation} {z}=Z\left({x},Y({x},{z})\right)\label{zz} \end{equation} という式ができる。計算の結果、この式は${z}={z}$という当たり前の式に戻る筈である。
上の例の${z}=\pm\sqrt{R^2-{x}^2-{y}^2}$に${y}=\pm\sqrt{R^2-{x}^2-{z}^2}$を代入してみると、 \begin{equation} {z}=\pm\sqrt{R^2-{x}^2-(R^2-{x}^2-{z}^2)}=\pm\sqrt{{z}^2}\label{zzkekka} \end{equation} となって、${z}={z}$になる(もともと複号は${z}$が正なら$+$、負なら$-$だったから、右辺は${z}$にしてよい)。
つまり、この式の右辺は${x}$を含んでいるように見えるが、実は含んでいない(計算をすれば消えてしまう)。ここで、両辺を「${z}$を一定として${x}$で微分」する。計算するまでもなく(${z}$を一定としているのだから)左辺の微分は0である。一方右辺は${x}$が2箇所にあることから微分の結果は二つの式の和となり、結果が0となる(二つの項が打ち消す)。すなわち、
\begin{equation} 0=\overbrace{\left( {\partial {Z({x},Y)}\over \partial x}\right)_{Y}}^{左の{x}を微分} +\overbrace{\left( {\partial {Z({x},Y)}\over \partial Y}\right)_{{x}}\left( {\partial {Y({x},{z})}\over \partial x}\right)_{{z}}}^{右の{x}を微分} \end{equation} が導かれる。
どんなものでもよいので${x},{y},{z}$の関係式${z}=Z({x},{y})$を作って、これから${y}=Y({x},{z})$を求めたうえで、上の$Z({x},Y({x},{z}))$にあたる式をつくり、その式を(簡略化せずにそのまま)${z}$で微分すれば1となり、${x}$で微分すれば0となることを確認せよ。
以上は計算による導出だが、次に図解を試みよう。変数の間の関係式を成立させつつ、
という三つの変化を起こして元の場所に戻ってくる経路を考える。
それぞれの過程において図に描き込んだような分数を計算し、その掛算を行うと、 \begin{equation} {{\Delta y}\over -{\Delta z}}\times {{\Delta z}\over -{\Delta x}}\times {{\Delta x}\over -{\Delta y}}=-1 \end{equation} となる(分母分子に同じものが2回ずつ現れ、分母にマイナスが3回現れる)。極限を取ればこれは \begin{equation} \left({\partial {y({x},{z})}\over \partial x}\right)_{{z}}\times \left({\partial {z({x},{y})}\over \partial y}\right)_{{x}}\times \left({\partial {x({y},{z})}\over \partial z}\right)_{{y}}=-1 \end{equation} になる。$\left({\partial {x({y},{z})}\over \partial z}\right)_{{y}}={1\over \left({\partial {z({x},{y})}\over \partial x}\right)_{{y}} }$であるこの場合は、同じ変数${y}$を固定しての微分だから、逆数になってよい。。
解ける形の常微分方程式として「全微分形である場合」があるので、その場合の解き方と、全微分形でない場合に全微分形に直していく方法について考えよう。
ある常微分方程式${\mathrm dy\over \mathrm dx}=f({x},{y})$を$P({x},{y})\mathrm dx + Q({x},{y})\mathrm dy =0$と変形して、なんらかの計算の後に$\mathrm d\left(なんとか\right)=0$の形にまとめ直すことができれば(すなわち、全微分$=0$の形に書き直すことができれば)、(なんとか)=定数、と積分ができる。
つまり、$P({x},{y})\mathrm dx + Q({x},{y})\mathrm dy$を$\left({\partial {f({x},{y})}\over \partial x}\right)_{{y}}\mathrm dx+\left({\partial {f({x},{y})}\over \partial y}\right)_{{x}}\mathrm dy$の形に直す、という方針で微分方程式を解くのである。
たとえば、${\mathrm dy\over \mathrm dx}={{x}^2+2{x}{y}\over -{x}^2+{y}}$は、 \begin{equation} ({x}^2+2{x}{y})\mathrm dx + ({x}^2-{y})\mathrm dy=0 \end{equation} と直した後に、 \begin{equation} \mathrm d \left({1\over 3}{x}^3 + {x}^2{y}-{1\over 2}{y}^2\right)=0 \end{equation} とまとめられるこのまとめ方をさっと思いつくのは難しいが、逆に微分を計算すると上の式に戻ることを確かめるのは易しい。ので、 \begin{equation} {1\over 3}{x}^3 + {x}^2{y}-{1\over 2}{y}^2=C(一定) \end{equation} が解である。このような手順も一つの常微分方程式の解き方である。
この定義から、全微分形なら「全微分じゃない場合ってあるの?」という疑問が湧くかもしれないが、その点は後で説明しよう。その常微分方程式は簡単に解ける。
積分可能条件が満たされてなかったら全微分形ではない。しかし、ここで$P\mathrm dx+Q\mathrm dy=0$の右辺が0なので、両辺にある関数$\lambda({x},{y})$を掛けて \begin{equation} \lambda({x},{y}) P({x},{y})\mathrm dx +\lambda({x},{y}) Q({x},{y})\mathrm dy=0 \end{equation} として、 \begin{equation} \begin{array}{rl} \left({\partial {U({x},{y})}\over \partial x}\right)_{{y}}&=\lambda({x},{y}) P({x},{y}),\\ ~~~\left( {\partial {U({x},{y})}\over \partial y}\right)_{{x}}&=\lambda({x},{y}) Q({x},{y}) \end{array} \end{equation} を満たすことができれば全微分形ではなかった微分方程式を全微分形に直せた。この掛算した$\lambda({x},{y})$のことを「積分因子(integrating factor)」と呼ぶ。積分因子は \begin{equation} \left({\partial{\left( \lambda({x},{y}) Q({x},{y}) \right)}\over \partial x}\right)_{{y}}-\left( {\partial{\left( \lambda({x},{y}) P({x},{y}) \right)}\over \partial y}\right)_{{x}}=0 \end{equation} すなわち \begin{equation} \begin{array}{rl} & \left( {\partial{\lambda({x},{y})} \over \partial x}\right)_{{y}} Q({x},{y}) -\left( {\partial{\lambda({x},{y}) } \over \partial y}\right)_{{x}} P({x},{y})\\ =& -\lambda({x},{y}) \left(\left( {\partial {Q({x},{y})}\over \partial x}\right)_{{y}}-\left( {\partial {P({x},{y})}\over \partial y}\right)_{{x}} \right) \\ \end{array} \end{equation} という方程式を満たせばよい。しかし、この式から$\lambda({x},{y})$の形を求めるのは一般には簡単ではない(また、この方程式の解$\lambda({x},{y})$は一意ではない)。たまたま、$\lambda$が${x}$のみの関数になるような場合はこの式が \begin{equation} {\mathrm d {\lambda({x})} \over \mathrm d x} Q({x},{y}) = -\lambda({x}) \left( {\partial {Q({x},{y})}\over \partial x}- {\partial {P({x},{y})}\over \partial y} \right)\label{lambdaketteij} \end{equation} という形になるので、少し解きやすくなる。実際に解くときには、いろいろな場合を想定して試行錯誤を行う。
まずは${x},{y}$という2変数の「座標」の関数の場合で話をする。$f({x},{y})$の「微係数」は$\left({\partial {f({x},{y})}\over \partial x}\right)_{{y}}$と$\left({\partial {f({x},{y})}\over \partial y}\right)_{{x}}$の二つがあった。この二つは「${x}$方向に移動した場合」「${y}$方向に移動した場合」の微小変化の微分係数であった。
微分は「独立変数の変化に対する従属変数の変化の割合」なのだから、独立変数の変化のさせ方として「斜めに移動した場合」を考えて微分を行ってもよいではないか、と考えるのは当然である。
そこで、上の図のように傾いた方向に$a$だけ動いた場合の変化を考えよう。つまり、${\Delta x}=a\cos\alpha,{\Delta y}=a\sin \alpha$と選ぶわけである。こうしておいて$f$の変化量を計算したのち、結果を移動量(今の場合$a$)で割ってから極限を取ると、 \begin{equation} \lim_{a\to0}{ f({x}+ \overbrace{a\cos\alpha}^{{\Delta x}},{y}+\overbrace{a\sin\alpha}^{{\Delta y}})-f({x},{y})\over a } =\left({\partial {f({x},{y})}\over \partial x}\right)_{{y}} \cos\alpha +\left({\partial {f({x},{y})}\over \partial y}\right)_{{x}} \sin\alpha\label{houkoubibun} \end{equation} となる。
この式の示すものはまさに「${x}$軸と角度$\alpha$を持った方向に移動したときの変化の割合」であり、「方向微分」と呼ぶ。$\alpha=0$なら単に$\left({\partial {f({x},{y})}\over \partial x}\right)_{{y}}$となって「${x}$による偏微分」になる($\alpha={\pi\over 2}$なら、「${y}$による偏微分」になる)。関数$f({x},{y})$に対し、平面上の各点各点にベクトル$\left(\left({\partial {f({x},{y})}\over \partial x}\right)_{{y}},\left({\partial {f({x},{y})}\over \partial y}\right)_{{x}}\right)$が決まる。
このベクトルを「${\rm grad}~ f$」$\sin \theta$が$\sin$と$\theta$に分離できないように、${\rm grad}~ f$も${\rm grad}$と$f$は分離できない。${\rm grad}$だけでは(後に微分される相手がなければ)意味がない。または「$\vec\nabla f$」と表すこともある。「grad」は「グラディエント」と読み、「gradient(勾配)」の略である記号$\nabla$は「ナブラ」と読む(ベクトル記号は付けない場合も多い)。。${\rm grad} f$を知れば全ての方向の偏微分係数がわかる。
上の式ベクトル${\rm grad} f({x},{y})$とベクトル$\left(\cos \alpha,\sin \alpha\right)$の内積である、とも言える。方向微分の大きさは$\alpha$の変化により \begin{equation} - \sqrt{ \left({\partial {f}\over \partial x}\right)^2+ \left({\partial {f}\over \partial y}\right)^2} \leq \left({\partial {f}\over \partial x}\right) \cos\alpha +\left({\partial {f}\over \partial y}\right) \sin\alpha \leq \sqrt{ \left({\partial {f}\over \partial x}\right)^2+ \left({\partial {f}\over \partial y}\right)^2} \end{equation} の範囲で変化する(長くなるので$({x},{y})$等を省略)二つのベクトル$\vec a,\vec b$の内積$\vec a\cdot\vec b$の値は$-|\vec a||\vec b|\leq\vec a\cdot\vec b\leq \vec a\cdot \vec b$の範囲であり、今の場合の$\vec b$にあたる$\left(\cos \alpha,\sin \alpha\right)$の長さは1である。。
右のような二つの特別な場合を考えよう。
方向微分が0になる場合の$\left(\cos \alpha,\sin \alpha\right)$と、方向微分が最大となる場合の$\left(\cos \alpha,\sin \alpha\right)$は直交している。山の斜面に立ったとき「傾きがない方向(等高線に沿って移動する方向)」と「傾きが最大の方向(山を登る方向)」は常に直交している、ということになる。
たとえば前に考えた$f({x},{y})=\sqrt{{x}^2+{y}^2}$という関数の場合、偏微分係数の作るベクトルは \begin{equation} \begin{array}{rl} \left(\left({\partial {f({x},{y})}\over \partial x}\right)_{{y}},\left({\partial {f({x},{y})}\over \partial y}\right)_{{x}} \right) =\left( {{x}\over\sqrt{{x}^2+{y}^2} } , {{y}\over\sqrt{{x}^2+{y}^2} } \right) \end{array} \end{equation} である(\式{Rzenbibun}を見よ)。図に示した黒矢印がこの偏微分係数のベクトルである(各点ごとに違う方向を向く)。このベクトルの長さは、$\sqrt{\bigl({{x}\over\sqrt{{x}^2+{y}^2} }\bigr)^2+\bigl({{y}\over\sqrt{{x}^2+{y}^2} } \bigr)^2 }=1$になる。 一方、これに垂直なベクトルを白矢印で示した。白矢印の方向は「$\sqrt{{x}^2+{y}^2}$のこの方向への微分が0になる方向」すなわち、「$\sqrt{{x}^2+{y}^2}$が変化しない方向」である(今の場合は$\sqrt{{x}^2+{y}^2}$が原点からの距離であることを思えば自明)。
2次元の位置を表現するのによく使われるのは直交座標(デカルト座標)で、${x},{y}$の二つを使って位置を表現する。もう一つよく使われるのが極座標で、これは原点からの距離${r}=\sqrt{{x}^2+{y}^2}$と、どの方向に原点から離れているかを意味する${\theta}$で位置を表現するその意味からして、${r}=0$(原点)では座標${\theta}$は無意味になることに注意。。図からわかるように以下のような関係がある。 \begin{equation} \begin{array}{ccccc} {x}={r}\cos {\theta}&,&{y}={r}\sin {\theta}&,&\\[2mm] \cos{\theta}={{x}\over \sqrt{{x}^2+{y}^2}}&,&\sin{\theta}={{y}\over \sqrt{{x}^2+{y}^2}}&,& {r}=\sqrt{{x}^2+{y}^2}~~~~~~~~~~~~~~ \end{array} \end{equation}
${r}$方向の方向ベクトルは$(\cos\theta,\sin\theta)$なので、その方向微分は \begin{equation} {\partial f\over\partial r}=\cos {\theta}{\partial {f}\over \partial x}+\sin {\theta}{\partial {f}\over \partial y}\label{rhoukou} \end{equation} となる。
この式は、 \begin{equation} {\partial {f\bigl(x({r},{\theta}),y({r},{\theta})\bigr)}\over \partial r} ={\partial {f({x},{y})}\over \partial x}{\partial {x({r},{\theta})}\over \partial r} +{\partial {f({x},{y})}\over \partial y}{\partial {y({r},{\theta})}\over \partial r}\label{delfdelrkekka} \end{equation} と考えても出てくる。
ここで、$x({r},{\theta})={r}\cos {\theta},y({r},{\theta})={r}\sin {\theta}$であることから、 \begin{equation} {\partial {x({r},{\theta})}\over \partial r}=\cos{\theta},~~ {\partial {y({r},{\theta})}\over \partial r}=\sin{\theta}\label{delxdelr} \end{equation} である。これが偏微分の場合のchain ruleに対応する。
青字は受講者からの声、赤字は前野よりの返答です。