最小作用の原理はどこからくるか?

 この項は解析力学をよくわかっている人にとっては「何をいまさら」な内容であることをお断りしておく。むしろ、解析力学の最初でつまづいちゃってにっちもさっちもいかなくなった人向けに書いている。解析力学の達人から見れば、以下の説明は高尚さが足りないように思うかもしれないが、そういうわけなので許して欲しい。

 解析力学には『最小作用の原理』というものがある。

作用(ラグランジアンの時間積分)が最小になるような運動が実現される運動である。

と表現される原理で、ラグランジアンはたいていの場合、

(運動エネルギー) - (位置エネルギー)

と表される。実際は最小とは限らない(状況によっては最大値になっていることもある)ので、「最小」というよりは「微分してゼロ」と考えるべきだ、ということは別の項目で書いた。だからほんとは「停留作用の原理」とか呼ぶべきなんだろう。だから以下の文章では慣例に従って「最小」という言葉を何度か使うけど、それは「最小または最大」(より厳密には「極大または極小」か)とか「停留」とか書きたいところなのだ。というわけで以下の文章で「最小」と書いてあっても、それは「極大または極小」の意味だと理解してくれたまい。

 まぁそれはさておき。大学2年生あたり相手に解析力学の授業などをすると、このあたりに関してもっともよく受ける質問は

「どうしてこれが最小になるんですか」

「なんで位置エネルギーを足さずに引くんですか」

「こんなことを考えなくてはいけない理由はなんですか」

「で結局のところ、作用っていったいなんなんですか」(だんだん声が大きくなる)

などなどである。

 まず「どうしてこれが最小になるんですか」という問いに対して、ぶっちゃけた答をまず先に書いてみよう。

「逆だっ。最小になるようなもんを探したらこれだったんだよっ!」(負けないように大きな声で)

びっくりしましたか?

 では、「最小になるようなもんを探したらこれになる」というところをちゃんと通して説明しよう。

まず静力学から考えよう

 運動している物体を考える前に、物体が止まっていて、つりあいの状態になっている時を考えよう。つりあいの条件は、x,y,zそれぞれの方向に働く力をF_x, F_y, F_zとした時、

$$F_x=0, F_y=0, F_z=0 $$

なのだが、別のところで書いた仮想仕事の原理から、ある方向(δx,δy,δz)への仮想変位を考えたとき、

$$ F_x \delta x+F_y\delta y+F_z \delta z=0$$

である、と言うこともできる。ここでもし力が適当な位置エネルギーUを用いて

$$ F_x= -{\partial U\over\partial x}, F_y= -{\partial U\over\partial y},F_z= -{\partial U\over\partial z}$$

で表されるような力(保存力)であったならば、この式は結局「Uの微分=0」と書ける。

エネルギーの極大極小

Umin.png

 つまり「Uが極大か極小になっている場所がつりあいの位置」ということになる。これは「物体はエネルギーの低いほうに行きたがる」という考え方で理解できる。極小になっている場所ではどっちに行ってもエネルギーが上がってしまう。だからその場にとどまる。これがいわゆる一つの「つりあい」である。極大になっている場所ではどっちに行ってもエネルギーが下がる。どっちにも行きたいが、それがゆえに逆にどっちにも行かずとまっている状態(当然、不安定であり、ちょっとでもつつけば落ちてしまう)である。これも「つりあい」の一種である。

 表現の仕方はどうあれ、大事なことは「Uの微分=0」が条件だということである。こういう条件にするのと、$F_x=0,F_y=0,F_z=0$のように3方向の力が0だとするのと、どう違うのか。もし違いがないなら、Uなどという量を考える必要は何もない。しかし実際にはエネルギーというものを考えた方が便利だ。一つの理由はUがスカラー量であって、座標変換に強い、ということである。たとえば今x、y、zという直交座標で考えたものをr、θ、φという極座標で考えろ、と誰かに命令されたとすると、Fの方は大変めんどくさいことになるが、Uの方なら比較的楽である。

 思いっきりぶっちゃけた話をしてしまえば、静力学の場合のポテンシャルというのは、「つりあいの場所で最低になるようなものを探したこれだった」と思ってもよい。ポテンシャルには、「この位置に持ってくるために必要な仕事」という意味がちゃんとあって、つりあいの位置だけで役に立つわけではないので、ちょっとこれはぶっちゃけすぎてしまっているが。

 以上で静力学の場合のポテンシャルというもののありがたさを説明したわけだが、そのありがたいポテンシャルのようなものを動力学の場合でも作れないだろうか、と考えてみる。

「経路」を動かす

keiro.png

 静力学では「仮想的に物体の位置を動かして・・・」と考えたわけだが、動力学の場合では「仮想的に物体の経路をねじまげて・・・」と考える。

 経路を捻じ曲げるには、xという「一つの数」を変化させるのではなく、x(t)という「一つの関数」の形を変化させねばならない。「経路」というのは1次元の広がりのある量(つまり、時空内に書かれた1本の線)なのだから当然だ。それに、静力学の場合、出てくる式は一つでよかったが、動力学の場合、時間によってx(t)が変化し、それに応じて働く力とかも出てくるから、出てくる式は時間の関数にならなくてはいけない。式をたくさん出すには、変化させるものもたくさんないとだめである。

 静力学の場合のUはxの関数でよかった。動力学の場合のUにあたるものは作用Iだが、Iはすべてのx(t)の関数でなくてはならない。具体的には、

$$I=\int L(x(t),({dx\over dt})(t), t)dt$$

のようにL(ラグランジアン)の積分でなくてはならない。そのようになるラグランジアンの形が最初に書いた(運動エネルギー)−(位置エネルギー)なわけだ。

 どうやってこの形を導出するのか、というのはどんな解析力学の本にも載っているだろうから、詳しい計算はそっちを参照してもらうとして、エッセンスだけを書いておくと、まず運動方程式を

$$ m{d^2x\over dt^2}= -{\partial U\over\partial x}$$

と書く。力をUの微分の形で表している。 これを

$$ -m{d^2x\over dt^2} -{\partial U\over\partial x}=0$$

の形に直す。こうやって(質量)×(加速度)の項を力と同じ扱いにできる、ということには「D'Alembertの原理」なるかっこいい名前がついているが、要は移項しただけのことだ。これにδx(t)という時間の関数をかける。このδx(t)は仮想仕事の原理におけるδxに対応する。つまり一種の仮想変位である。ここでの「仮想変位」は時間の関数になっていることに注意。場所を動かすのではなく経路を動かす(関数そのものを変える)ということが大事である。結果は、

$$\left(-m{d^2x\over dt^2}-{\partial U\over\partial x}\right)\delta x(t) =0$$

だが、これはいろんな時刻tにおける式である。その「いろんな時間」に関してこの式を積分する。この積分をする、という部分は、つりあいの式から仮想仕事の原理を出す時に、

$F_x=0,F_y=0,F_z=0$から$F_x \delta x+F_y \delta y+F_z \delta z=0$

のように「各成分が0」の式にそれぞれの成分に対するδをかけて足し算したのと同じ。今の場合、δがx,y,zの3つではなく、時間tの変化に応じて無限個あるのである。

 部分積分を1回すると、

$$\int \left(m{dx\over dt}{d\delta x\over dt}-{\partial U\over\partial x}\delta x\right) dt =0$$

となる。これは

$$\int\left({1\over2}m\left({dx\over dt}\right)^2-U(x)\right) dt$$

と、この式の中の経路x(t)をx(t)+δx(t)に置き換えたもの

$$\int\left({1\over2}m\left({d(x+\delta x)\over dt}\right)^2-U(x+\delta x)\right) dt$$

との変化量(δxの1次まで)である。この式を良く見ると、運動エネルギー${1\over2}mv^2$と位置エネルギーUの引き算を積分した量になっている。つまり、

(運動エネルギー) - (位置エネルギー)の変化量が0になりなさい

という式が運動方程式と等価である。

 変化量が0だからと言って最小とは限らない(この逆はOK:最小になる場所では微小変化は0になる)。最大になる場合もある。しかし上にも書いたように、何故か皆、昔から「最小作用の原理」と呼ぶ。

作用の変分の雰囲気をつかむために

 このあたりの感覚をつかむためのモデルを考えよう。図のような、穴のあいた質量mの球をばねでつないだものを用意し、一個ごとに一本の串にさす。

dango.png

 串と球の間にまさつはなく、自由に上下に動けるとする。球は重力により下に落下しようとするが、ばねによってひっぱられて、ちょうど位置エネルギーが最低になるような形になった時に停止すると思われる。その時、球がどんな形にならぶだろうか。

 ばねのエネルギーは自然長からの伸び縮みの自乗に比例する。簡単のために自然長0のばねを使うことにすると、ばねのエネルギーはばねの長さの自乗に比例するが、

$$(ばねの長さ)^2=(となりの球との高さの差)^2+L^2$$

となる。L2に対応する部分はどうせ定数だからと捨ててしまうことにすると、結局ばねのエネルギーは(となりの球との高さの差)2に比例するわけである。よって、この球とばねが持っているエネルギーは

$$-mgy_1 - mgy_2 -mgy_3 - \cdots -mgy_N+{1\over2}k(y_2-y_1)^2 + {1\over2}k(y_3-y_2)^2 +{1\over2}k(y_4-y_3)^2 + \cdots +{1\over2}k(y_N-y_{N-1})^2$$

となる。このエネルギーが最小値になるのがつりあいの状態である。

dango2.png

 この串にささった球を仮想変位させてみよう。全体を下げると、重力の位置エネルギーは減るが、その分ばねが下まで伸びなくてはいけないから、ばねの弾性エネルギーは増える。全体を上げる場合はこの逆である。

 どこかで、この増減がつりあって、ちょうどエネルギーが極値になるところがある。それが実際に実現する状態である。

 つりあいの方程式を作るためには、このエネルギーの式を$y_i$(iは1からNまで)で微分して0と置く。たとえば$y_3$で微分すれば、

$$-mg + k(y_3-y_2) - k(y_4-y_3)=0$$

すなわち、

$$k[(y_4-y_3) - (y_3-y_2)] = -mg$$

という式が出る。この式に出てくる$y_2-y_3$というのは「となりどうしのyの差」であるから、いわば微分である。そして$[(y_4-y_3) - (y_3-y_2) ]$はさらにその差であるから「差の差」つまり「微分の微分」である。というわけでこの式の左辺は${d^2y\over dx^2}$に比例する。その比例定数がたままmに等しいとすれば、

$$m{d^2y\over dx^2}=-mg$$

といういことになって、落体の運動方程式

$$m{d^2x\over dt^2}=-mg$$

によく似た方程式が出てくる。違いは、

ということである。ばねの弾性エネルギーが運動エネルギーに対応している。

 落体の運動の経路を変化させた時の様子を、この串に刺した球の列と同じように考えると、

keirohen.png

のような図で描ける。図がひっくり返ってはいるが、だいたい同じことになっているのがわかる。だから、この経路がばねやゴムのような弾性体で出来ていると考えて、びよ〜〜んと伸ばすとそれだけエネルギーが必要・・・と考え、そのエネルギーが運動エネルギーだと思えば、なんとなくイメージがつかめる。

なぜ位置エネルギーを引くのか?

 次に「どうして位置エネルギーを足さずに引くんですか?」という問いに対する答をしておこう。何度も書いているように、作用というのは「最小であるという条件が運動方程式になるように」作るのだから、これの答としては「ちゃんと運動方程式出すためにはマイナス符号がついてちょうどいいんだよ!」と言ってしまえばそれで終わりではある。

 しかし、どうせなら図なりなんなり、目に見える形で納得したいというのも人情であろう。そこで、こう考えると納得できるかもしれない説明を以下に書く。  上の串にさした球の話で、上下ひっくり返すことで落体の運動の経路になったところにこの説明の種がある。つまり、

下向きの力によって、経路は上向きに引っ張られる

のである。

 重力は上向きに作用する?? そんなばかなと思うかもしれないが、「ばかな」という前によく考えて欲しいのは、ここで考えている経路は「出発点と到着点を固定して、いろいろな経路を考えると」という前提つきの「経路」なのだ、ということである。

 重力などの外力がなければ、出発点と到着点を固定したら、そこをまっすぐにつないだ経路(つまりは、等速直線運動)が実現する経路である。では重力があったら???

 「いったん上に登って、また落ちてくる」という経路が実現する。その経路は、等速直線運動に比べ、上方向にずれていることになる。「経路は上向きに引っ張られる」と書いたのはそういう意味である。

gravity.png

 静力学の問題である串にさした球に働く重力は球を下にひっぱる(重力がなければ直線)のと逆である。つまり、

「力」によって起こる“変形”は、静力学と動力学では逆なのだ。

 別の言い方をすると、

「力」によって起こる“変形”は、物体の位置の話をしている場合と、
物体の経路の話をしている場合では逆なのだ。

 だから、この二つの問題では位置エネルギーの役割も逆になり、作用に入る位置エネルギーの前にマイナス符号が入ることになるのである。

 以上から、作用というものを少しでもイメージしたかったら、こんなふうに考えるとよいだろう。

 まず上のようなx-tグラフに書かれた経路をゴムひものようなものと考える。そしてそのゴムひもの両端を固定する。ゴムひものようなものだから、他に力がなければまっすぐの直線になるだろう。もし力が働いたとしたら、力は経路を「力の働く向き」とは逆に引っ張るので、上に書いた図のように、経路が「いったん位置エネルギーの大きいところ(↑)に行ってまた帰ってくる」という形になる。

 「経路をゴムひもと考えた時の弾性エネルギー」と「通常とは逆向きに働く力による位置エネルギー」の和が「作用」である。これが極値になるような経路が、実際に実現する運動になる。

なぜこんなものが必要なのか?

 さて、この最小作用の原理、これまた多い疑問が「なぜこんなことを考えなくてはいけないのですか?」ということだ。今までの話からすると、結局は運動方程式を出すためらしい。しかしそれなら最初から運動方程式を出せばいいじゃないか、と思うかもしれない。わざわざ遠回り(に見える)作用なるものを導入するのはなぜなのか。

 まず、最初から運動方程式を出す、というのがそんなに簡単ではない場合がよくある、ということ。これは実際に難しい問題をラグランジュ形式で解いてみると実感できる。  もう一つは、(静力学のポテンシャルと同じだが)座標変換に強いということ。直交座標から極座標へというような座標変換はもちろんのこと、もっと複雑怪奇な座標変換に対しても、ラグランジュ形式(最小作用の原理)は強い。

 そしてもう一つは、作用の形からいろんなことがわかったりするということ。作用の不変性から何かの保存則が導かれたり(たとえば運動量保存則が作用の形から導かれたりする)、作用の形が似ていることから違う物理現象を同じ方法で調べることができたり。一般的に現象を記述する方法として便利だということが言える。

 何にせよ、簡単な問題を考えている限りは、最小作用の原理のありがたみはわかりにくいかもしれない。しかしいつか難問に立ち向かう時に、いろんな手助けをしてくれるのが最小作用の原理なのである。

 最後に「で、結局のところ、作用って何なんですか?」という疑問については悪いけど、短い答はない。作用は作用である。上に書いたようなことを考えて便利になるように作ったものであって、一言で表せるもんではないわい、ということになる。

量子力学との関連

 話を量子力学にもっていくと、作用というのはちょうど量子力学の波動関数の位相に対応している。これが停留値を取るということは、位相の変化が小さい(局地的に変化しなくなっている)ということである。逆に位相の変化が大きいとどうなるかというと、波動関数は激しくプラスマイナスを変化させるといるということになり、そのような運動は重ね合わせによって消えてしまう。古典力学において「最小作用が選ばれる」ということは量子力学では「最小作用の場所以外を通る道は互いに干渉して消える」と翻訳される。ラグランジュやハミルトンは自分たちの作った最小作用の原理にこんな解釈が後に与えられるとは思ってもみなかったに違いない。このあたりの話は「初等量子力学」の講義録第8回にも書いたので参照して欲しい。


添付ファイル: filekeirohen.png 922件 [詳細] fileUmin.png 744件 [詳細] filedango2.png 674件 [詳細] filegravity.png 736件 [詳細] filedango.png 673件 [詳細] filekeiro.png 761件 [詳細]

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2024-01-12 (金) 19:41:50