解ける形の微分方程式として「全微分形である場合」があるので、その場合の解き方と、全微分形でない場合に全微分形に直していく方法について考えよう。ついでにこの後でも使う「偏微分」の記号に慣れておこう。
そもそも微分方程式を解くとは、なんらかの意味で積分を行うことであった。微分を含むある式
\begin{equation} P({x},{y})\mathrm dx + Q({x},{y})\mathrm dy =0\label{kanzenkeikana} \end{equation}をなんらかの計算を行った結果として、
\begin{equation} \mathrm d \left( \fbox{なんとか}\right)=0 \end{equation}という形にまとめ直すことができれば、なんとか=定数と積分ができる。たとえば、
\begin{equation} ({x}^2+2{x}{y})\mathrm dx + ({x}^2-{y})\mathrm dy=0 \end{equation}という式は、
\begin{equation} \mathrm d \left({1\over 3}{x}^3 + {x}^2{y}-{1\over 2}{y}^2\right)=0 \end{equation}とまとめられる。
よって、
\begin{equation} {1\over 3}{x}^3 + {x}^2{y}-{1\over 2}{y}^2=C(一定) \end{equation}が解である。
このような手順も一つの微分方程式の解き方である。
この$\mathrm d \left( \fbox{なんとか} \right)$という形の式をなんとかの「全微分(exact differential)」(あるいは「完全微分」)と呼ぶ。そして、こういう形の式は「全微分形(exact)」(あるいは「完全微分形」)英語の形容詞は「exact」だが日本語では「微分」を補って使う場合が多い。になっていると言う。この定義から、全微分形ならその微分方程式が解けるのは言わば当たり前である。
${\mathrm dy\over \mathrm dx}=f({x},{y})$を例として考える。右辺の$f({x},{y})$は、${x}$と${y}$の両方を含む式である。微分方程式が「解ける」ということは、これから、(いくらかの計算の後に)\begin{equation} U({x},{y})=C(定数)\end{equation}という式(${x}$と${y}$の関係式)を導けたということである。逆に、この式を微分することで(あるいは、微分した後少々計算することで)上の式に戻るだろう。
これまでに解いてきた微分方程式の場合で、一定となる量$U({x},{y})$を列挙する(どうやって解いたかは思い出してもいいし、変数分離できる例なのでもう一度解くのも簡単なはず)。
(1) | (2) | (3) | (4) | (5) |
微分方程式 | 変数分離した形 | 解 | 一定となる量$U$ | $U$の全微分 |
${\mathrm dy\over \mathrm dx}=-{{x}\over {y}}$ | ${x}\mathrm dx+{y}\mathrm dy=0$ | ${x}^2+{y}^2=R^2$ | ${x}^2+{y}^2$ | $2{x}\mathrm dx+2{y}\mathrm dy$ |
${\mathrm dy\over \mathrm dx}=-{{y}\over {x}}$ | ${1\over {x}}\mathrm dx+{1\over {y}}\mathrm dy =0$ | ${y}={C\over {x}}$ | ${{x}{y}}$ | $ {y}\mathrm dx+ {x}\mathrm dy$ |
${\mathrm dy\over \mathrm dx}={{y}\over {x}}$ | $- {1\over {x}}\mathrm dx+{1\over {y}}\mathrm dy =0$ | ${y}=C{x}$ | ${{y}\over {x}}$ | $-{{y}\over {x}^2}\mathrm dx+ {\mathrm dy\over {x}}$ |
${\mathrm dy\over \mathrm dx}={y}$ | $-\mathrm dx+{1\over {y}}\mathrm dy=0$ | ${y}=C\mathrm e^{{x}}$ | ${y}\mathrm e^{-{x}}$ | $ - {y}\mathrm e^{-{x}}\mathrm dx + \mathrm e^{-{x}}\mathrm dy$ |
というのが変数分離を使って解く微分方程式の解法だが、
という微分方程式の解法も有り得るこの場合、変数分離不可能でも解ける可能性が出てくる。。
この「全微分形に直す」という解法を考えるために、上の例それぞれの場合で(2)と(5)の違いを見てみよう。
${\mathrm dy\over \mathrm dx}=-{{x}\over {y}}$の場合 (2)と(5)は定数倍(2倍)違うが、同じ結果だと言える。
${\mathrm dy\over \mathrm dx}=-{{y}\over {x}}$の場合 (2)と(5)は${{x}{y}}$倍違う。
${\mathrm dy\over \mathrm dx}={{y}\over {x}}$の場合 (2)と(5)は${{y}\over {x}}$倍違う。
${\mathrm dy\over \mathrm dx}={y}$の場合 (2)と(5)は ${1\over {y}\mathrm e^{-{x}}}$倍違う。
以上の例から、解ける微分方程式であっても、単に$P\mathrm dx+Q\mathrm dy=0$の形にしただけでは全微分形にはなっていないこともあることがわかる。しかし、適当に何かの数もしくは関数を掛けてやることで全微分形に直していくことができる場合もある常にできるとは限らないが、これができるならこのやり方で解ける微分方程式だったということ。。
したがって微分方程式を「全微分形にする」という方針で解こうとするのであれば、方程式に適切な関数を掛けるという操作が必要になりそうである。
一つの可能性として、$U={x}^m {y}^n$という特別な場合を考えてみよう。$U$を微分すると、
\begin{equation} {x}^m{y}^n=C~~~を微分して~~~~ m{x}^{m-1}{y}^n\mathrm dx + n{x}^m{y}^{n-1}\mathrm dy =0\label{Uxy} \end{equation}となる。この逆に
\begin{equation} m{x}^{m-1}{y}^n\mathrm dx + n{x}^m{y}^{n-1}\mathrm dy =0 ~~~を積分して~~~~ {x}^m{y}^n=C \end{equation}であることを思いつければ微分方程式が解ける。すなわち、
\begin{equation} \underbrace{m{x}^{m-1}{y}^n}_{{x}^m{y}^nを{x}で\atop 微分したもの}\mathrm dx + \underbrace{n{x}^m{y}^{n-1}}_{{x}^m{y}^nを{y}で\atop 微分したもの}\mathrm dy =0\label{mxny} \end{equation}のように思いつけばよい。以上を頭に入れておくと、たとえば
\begin{equation} {y}\mathrm dx -{x}\mathrm dy=0\label{monenminusone} \end{equation}という微分方程式が出てきた時、「これは$m=1,n=-1$という状況では?」と予想することができるこういう予想が成立する為には、二つの項が${x},{y}$について同次(今の場合はどっちも2次)である必要がある。。二つの式を見比べるとこのままでは一致しないが、の両辺を${y}^2$で割ると、\begin{equation} {1\over {y}}\mathrm dx -{{x}\over {y}^2}\mathrm dy=0 \end{equation}となり、これが${{x}\over {y}}=(定数)$という式の全微分であることがわかる。微分方程式に出てくる項の${x},\mathrm dx$の次数と${y},\mathrm dy$の次数が一致しているような場合(ここで解いた式の場合、${x},\mathrm dx$の1次、${y},\mathrm dy$の1次だった)、適当な$m,n$見つけて全微分に直すことができる。
もっと一般的な形として、\begin{equation} f'({x}){y}\mathrm dx+f({x})\mathrm dy=0 \end{equation}のような微分方程式があったならば、\begin{equation} \mathrm d \left(f({x}){{y}}\right)=0 \end{equation}という形にまとめていくことで解いていくことができそうだ。
ここで、注意しなくてはいけないのは、$\underbrace{m{x}^{m-1}{y}^n}_{{x}^m{y}^nを{x}で\atop 微分したもの}$、すなわち
${x}^m{y}^n$を${x}$で微分して答は$m{x}^{m-1}{y}^n$になった
という時の「微分」は単なる微分とは違っていることである。というのは、この計算をやっている時、あたかも${y}$は定数であるかのごとく扱っている。実際のところ${x}$と${y}$は連動して変化する(たとえば$m=n=1$の例では${x}{y}$が一定だから、${x}$が増えれば${y}$は減る)のに、あえて変化しないと考えている。
このように、上の計算では、「実際は{変数}であるものを定数であるかのごとく扱って微分する」ということを行っている。
ここで、「変数を勝手に定数にしてはいけないのでは?」と悩む人が多いので注意しておこう。ここでやっていることは、${x}{y}$を一定にしつつ${x},{y}$を変化させているのだから、${x}$と${y}$は同時に連動して変化する。図示すれば次の図のような変化であり、同時に起きた二つの変化を「$y$の変化による部分(${x}\mathrm dy$)」と「$x$の変化による部分(${y}\mathrm dx$)」に分けて計算している。
${y}$を定数にしたのではなく、${y}$の変化による部分は第2項で計算しているから、第1項では省いているだけのことである。変化するはずの${y}$は、ちゃんと変化させていて、その分は第2項で計算しているので、心配無用である。
次の節で、この新しい形式の微分に名前と定義を与えよう。
前節の最後で必要となった微分の方法、すなわち「実際は変数であるものを定数であるかのごとく扱って微分する」という微分を「偏微分(partial differentiation)」という。「偏微分」は名前の通り「肉と野菜を出されたのに、偏食して、肉しか食べない」という時の「偏」である。「偏りのある微分」(英語ではpartialで「一部だけを微分する」という意味を表している)である。つまりは変数が二つ(ときには、三つ以上)あるのに、その変数のうち一個だけに着目して微分を行う。
偏微分という具体的計算を式で定義しておこう。${x}$と${y}$に依存するある式$f({x},{y})$があるとする。${y}$を一定として${x}$で偏微分するという計算を
\begin{equation} \lim_{{\Delta x}\to0}{ f({x}+{\Delta x},{y})-f({x},{y}) \over {\Delta x} }\label{delfdelx} \end{equation}で定義する。これまでの微分(区別をつけるために「常微分」と呼ぶ)が
\begin{equation} {\mathrm d\over \mathrm dx} f({x})= \lim_{{\Delta x}\to0}{ f({x}+{\Delta x})-f({x}) \over {\Delta x} }\label{dfx} \end{equation}だったことを思うと、もう一つの変数${y}$がついている(しかし定数として扱っている)以外は同じ計算である。偏微分は常微分とは違う記号を使うことにして、
\begin{equation} \left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}= \lim_{{\Delta x}\to0}{ f({x}+{\Delta x},{y})-f({x},{y}) \over {\Delta x} } \end{equation}と書く。$\mathrm d $ではなく$\partial$という記号を使い、かつ「(本当は変数なんだけど)定数として扱っている文字」を$\left(~~\right)_{{y}}$のように括弧の後につけて表現する。
もちろん逆に${x}$を一定として${y}$で偏微分するという計算は
\begin{equation} \left( {\partial f({x},{y})\over \partial y}\right)_{\!\!{x}} =\lim_{{\Delta x}\to0}{ f({x},{y}+{\Delta y})-f({x},{y}) \over {\Delta y} }\label{delfdely} \end{equation}である。どちらも、一方で微分する時はもう一方をあたかも定数であるかのように扱っている。ここまでの話として、常微分が偏微分に変わったことで特に難しいところはないはずだ。
例をいくつか上げておく。
\begin{equation} \begin{array}{lcll} f({x},{y})= {x}^2{y}&:&\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}= 2{x}{y},&\left( {\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}= {x}^2\\[6mm] f({x},{y})= \sin ({x}+{y}^2)&:&\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}= \cos({x}+{y}^2),&\left({\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}=2{y}\cos({x}+{y}^2) \end{array} \end{equation}微分の表現として、$f({x}+\mathrm dx)=f({x})+f'({x})\mathrm dx$もしくは、$\mathrm df=f'({x})\mathrm dx$という書き方(具体例で示せば、$\cos ({x}+\mathrm dx)=\cos {x}-\sin{x}\mathrm dx$もしくは$\mathrm d (\cos{x})=-\sin{x}\mathrm dx$など)があったが、それの偏微分のバージョンは
\begin{equation} \begin{array}{c} f({x}+\mathrm dx,{y}+\mathrm dy) =f({x},{y})+ \left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}\mathrm dx +\left({\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}\mathrm dy\\[6mm] もしくは\\[3mm] \mathrm df({x},{y})=\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}\mathrm dx +\left({\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}\mathrm dy \end{array}\label{zenbibun} \end{equation}となる。これを示すには、
\begin{equation} f({x}+\mathrm dx,{y}+\mathrm dy)-f({x},{y}) = f({x}+\mathrm dx,{y}+\mathrm dy)\underbrace{ -f({x}+\mathrm dx,{y}) +f({x}+\mathrm dx,{y})}_{0}-f({x},{y}) \end{equation}のようにしてから前の2項が
\begin{equation} f({x}+\mathrm dx,{y}+\mathrm dy)-f({x}+\mathrm dx,{y}) =\left({\partial f({x}+\mathrm dx,{y})\over \partial y}\right)_{\!\!{x}}\mathrm dy \end{equation}に$\mathrm dx,\mathrm dy$の1次の項までを考えるならば、$\left({\partial f({x}+\mathrm dx,{y})\over \partial y}\right)_{{x}}\mathrm dy=\left({\partial f({x},{y})\over \partial y}\right)_{{x}}\mathrm dy$である。、後の2項が
\begin{equation} f({x}+\mathrm dx,{y})-f({x},{y})=\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}\mathrm dx \end{equation}になると考えればよい。この式は\式{delfdelx}と同じ意味を持つ式である。上の例に則して書けば、
\begin{equation} \begin{array}{rll} \mathrm d \overbrace{({x}^2{y})}^{f({x},{y})}=&\overbrace{2{x}{y}}^{\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}}\mathrm dx&+\overbrace{{x}^2}^{\left({\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}} \mathrm dy\\[4mm] \mathrm d \underbrace{ (\sin({x}+{y}^2))}_{f({x},{y})}=&\underbrace{\cos({x}+{y}^2)}_{\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}}\mathrm dx &+ \underbrace{2{y}\cos({x}+{y}^2)}_{\left({\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}}\mathrm dy \end{array} \end{equation}となる。新しい記号を使ってはいるが、この計算は別に目新しいものではないし、ここまでの段階では偏微分は単に「本当は定数である文字を定数とみなして微分する」というだけで難しいことは特に無い(偏微分ならではの難しさがあるのだが、それは現段階ではまだ出てきていない。後で登場する)。
全微分
\begin{equation} \mathrm df({x},{y})=\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}\mathrm dx+\left({\partial f({x},{y})\over \partial y}\right)_{\!\!{x}}\mathrm dy\label{koregazenbibun} \end{equation}を「$f({x},{y})$の全微分」と呼ぶ。
上の式は
というふうに「読む」べきである。
全微分のうち、「$\mathrm dx$の係数である$\left({\partial f({x},{y})\over \partial x}\right)_{\!\!{y}}$」を取り出したものが「偏微分」である。
偏微分という計算が威力を発揮するのは、独立変数が1つでなく複数個ある場合であるが、そのような場合については後の章に回す。偏微分には、常微分と違っている点として注意すべきポイントがいくつかあるのだが、このポイントについてもそこで述べることにする。
たとえば、$f({x},{y})=\sqrt{{x}^2+{y}^2}$(原点から点$({x},{y})$までの距離を表す関数)という量を考える。この全微分は
\begin{equation} \mathrm d \left(\sqrt{{x}^2+{y}^2}\right)= {{x}\over\sqrt{{x}^2+{y}^2} }\mathrm dx +{{y}\over\sqrt{{x}^2+{y}^2} }\mathrm dy \end{equation}である。
下の図に、${x}$だけが変化した場合(左図)と${y}$だけが変化した場合(右図)の距離$\sqrt{{x}^2+{y}^2}$の変化が確かに上の式の第1項と第2項で表されることを示した。
一般的な、$({x},{y})$が$({x}+\mathrm dx,{y}+\mathrm dy)$と変化したときの原点からの距離の変化は「${x}$の変化による部分」と「${y}$の変化による部分」の足算として計算できる(もちろん、微小な範囲でのことである)。
ここで、この全微分の結果が0、すなわち$\mathrm d \left(\sqrt{{x}^2+{y}^2}\right)=0$という式を少し変形すると、
$$ x\mathrm dx+y\mathrm dy=0 $$になる。さらに言えば、
$$ \mathrm dx:\mathrm dy=y:(-x) $$である。
もう一つの例をやっておこう。 ${x}{y}=一定$、つまり反比例の場合の全微分
\begin{equation} {y}\akadx + {x}\aody=0 \end{equation}を考えれば$\akadx:\aody=-{x}:{y}$となっている。
${y}\akadx + {x}\aody=0$から${x}{y}=一定$を求めるのは、各点における接線の傾きからこの双曲線を導き出す、という計算であり、逆に「全微分を求める」というのは接線から傾きの比を求める計算だったと思ってもよい。
今日の小テスト
$-x^2+y^2=a^2$($a$は定数)の全微分を計算し、この場合に$\mathrm dx:\mathrm dy$がどのようになるかを計算せよ。という問題で、グラフは上の図でも出せる形。
解答
全微分は、だいたいの人はできていたが、
などの誤答があった。
青字は受講者からの声、赤字は前野よりの返答です。
↑偏微分のグラフを見せるプログラムの名前が、「henbiun」と間違ってました。