「ビューティフル・マインド」からひもとく「ゲーム理論」

Pocket

映画からひもとく、数学の世界です。

映画「ビューティフル・マインド」

ビューティフル・マインド(A Beautiful Mind)は、実在の天才数学者ジョン・ナッシュの偉業と成功、及びその後の統合失調症に苦しむ人生を描いた、2001年の伝記映画。
監督は、ロン・ハワードコクーンバックドラフトアポロ13ダ・ヴィンチ・コード3部作、ザ・ビートルズ〜EIGHT DAYS A WEEKなど)、主演はラッセル・クロウバーチュオシティL.A.コンフィデンシャルグラディエーターロビン・フッドレ・ミゼラブルなど)です。

プリンストン大学院の数学科に入学したジョン・ナッシュは、「この世の全てを支配できる理論を見つける」という野心を抱き、一人研究に没頭します。
結果的に、いくつか画期的な理論を発見するに至りますが、その過程で統合失調症を患い、一時は精神病院に通うまで悪化します。
しかし妻アリシアの献身的な愛情により、やがて寛解します。

統合失調症という言葉が耳慣れなくても、精神分裂症と言えば、少しはイメージが湧くかもしれません(日本では2002年までは精神分裂症と言われていました)。
英語で言うと” schizoid(スキッツォイド)“ですね。

統合失調症は妄想、幻覚、まとまりのない思考や発語、異常な運動行動などが症状として現れますが、ジョン・ナッシュの場合は、

  • 実在しないルームメイトやその姪の幻覚
  • 実在しない政府組織のエージェントや建造物などの幻覚
  • 自分が世界で最も重要な人物であり、政府組織から架空の極秘任務を依頼されているという妄想

などが酷く、時として健全な社会生活に支障をきたすほどでした。

統合失調症の原因は未だ解明されていませんが、ナッシュの場合

  • 周囲の評価が高くない中でもっと認められたいという願望
  • 父親として一家をささえなければいけないが上手くいかないジレンマ(ルームメイトの姪の幻覚)
  • ナッシュ独自の科学的思考による過度なプレッシャー、特に当時専心していたリーマン予想(数学界最大の難問、ミレニアム懸賞問題のひとつ)を証明することの難しさ

などが原因だったと伝えられています。

映画に関して個人的な感想を言えば、そもそも、

「繊細な統合失調症の大天才」のキャスティングが、何故、L.A.コンフィデンシャルやグラディエーターの印象が強烈(かつ私生活でもかなりハチャメチャ)な「チョー肉体派」ラッセル・クロウ?(笑)

という違和感がバリバリありながらも、奥さん役のジェニファー・コネリーの美貌や演技、感動的なラブストーリー、精神疾患に対する啓発など、十分及第点で面白かったです。

現に巷の評判も非常に高く、アカデミー作品賞、監督賞、助演女優賞、脚色賞に輝く「名作」との誉れ高い作品です。

未見なら一度は観たらいかがでしょう、とお勧めできる映画です。

 

数学とは何のための学問か?

さて、映画は冒頭、こんなセリフから始まります。

数学者が、戦争を勝たせた。
数学者が日本軍の暗号を解き、原爆を作った。
君らも、その数学者だ。
次のモールスは誰だ。
次のアインシュタインは誰だ。
アメリカの未来は、君らの手の中にある。
プリンストンへようこそ。

しびれますねぇ。

数学が戦争に勝つ手段(道具)とされていた、という点で、忌み嫌う向きもありましょうが、まさにその点が、アメリカ数学の、特にジョン・ナッシュ個人の「強み」になったのです。
つまり、数学の実践的応用分野の開拓とでも言いましょうか。

ジョン・ナッシュは、経済学や軍隊などの複雑な現実のシステムにおける意思決定を、数学がどのように説明できるか、を示しました。
その結果、後に彼が受賞したのは、ノーベル賞です。
そう、数学界のノーベル賞と言われるフィールズ賞ではなく、ノーベル経済学賞でした。

余談になりますが、かのアインシュタインノーベル物理学賞を受賞した対象論文は、相対性理論に関するものではなく、ブラウン運動の研究に関するものでした。

これは私が大学で初めて英語で読んだ物理論文だったのですが、逆に言うと、学部1年生が読むものとして取っつきやすく、それぐらい平易に書かれた優れた論文だったということですね。今から考えると。
確かにブラウン運動(水に浮かんだ花粉などの不規則な運動)の研究によって原子の存在を間接的に証明した功績は、小さくはありません。
しかしながら、物理界に与えた影響の大きさから言えば、ノーベル賞に相応しいのは特殊相対性理論一般相対性理論の方だと、誰しもが思うことでしょう。

ナッシュの業績に対する評価についても、同様な「ソコじゃない感」を感じてしまうのは私だけでしょうか。

またまた余談になりますが、私が大学で学んだのは、数学です。
但し、理学部で純粋数学を学んだのではなく、工学部で応用数学を学びました。
応用数学とは、極く簡単に言えば「企業のための計算屋」になるための修行、という感じでしょうか(笑)。

でもこれは意外にも面白くて、確率論などの基礎的な論理体系からはじまり、ゲーム理論待ち行列理論線形計画法巡回セールスマン問題最大流問題等のOR(オペレーションズ・リサーチ)や経営工学まで幅広く、こんなことにも数理モデルが使われているんだ! と目から鱗の連続でした。

広義に言えば、PM(プロジェクト・マネジメント)SCM(サプライチェーン・マネジメント)なども含め、経営工学とは「どうやったら効率的に経営リソースを使って最大利益を挙げるか?」や「どうやったら最短時間で成果を出せるか?」といったビジネス的・経営的観点での疑問に答えるべくして発達してきた手法であり、もともと軍隊やNASADupontなどオペレーショナルな最適を目指す組織体の要請で始まった研究です。

極論すれば、理論化できない多変量シミュレーションモデルであっても、変量(パラメータ)の置き方や評価関数の定義などに応用数学的手法を用いることはよくある訳で、そういう意味でも、数学屋の活躍できるフィールドは非常に広いのです。
例えば、スーパーコンピュータによる「ウィルス感染の拡がり」シミュレーションとか、「海洋投棄した放射性廃棄物の安全性シミュレーションとか。

是非、数学と言っても毛嫌いせず、実生活やビジネスに直結的に役立つ使い方がたくさんあるんだということを、知って欲しいと思います。

我田引水と言われてもいいです(笑)

 

ジョン・ナッシュの業績

さて、ジョン・ナッシュが残した主な業績は、大きく「ゲーム理論」と「微分幾何・偏微分方程式」の2分野に亘ります。

ゲーム理論の業績

  • 多者非協力ゲームにおける均衡点 "Equilibrium Points in N-person Games" (1950年)
  • 交渉問題 "The Bargaining Problem" (1950年)
  • 二者協力ゲーム "Two-person Cooperative Games" (1953年)

プリンストン大学博士課程在学中はゲーム理論を研究し、1950年に博士号を取得。
この時何と、22歳! です。

微分幾何・偏微分方程式の業績

  • 実代数多様体 "Real algebraic manifolds" (1952年)
  • C1クラスの(連続微分可能な)等長埋め込み "C1-isometric imbeddings" (1954年)
  • リーマン多様体への等長埋め込み問題 "The imbedding problem for Riemannian manifolds" (1956年)
  • データを用いた陰関数問題の解の分析 "Analyticity of the solutions of implicit function problem with analytic data" (1966年)

ゲーム理論の研究は純粋数学的には評価に値しないとナッシュ自身も思っていたらしく、ゲーム理論で博士論文が通らなかった場合に備え、当時から微分幾何(リーマン多様体への埋め込み問題)の研究にも着手していました。
そして、ゲーム理論の研究が一通りまとまった後、上記の重要な論文を残しました。

ナッシュの自己評価と世間からの評価

実際ナッシュ自身、「ゲーム理論は私の仕事の中で特につまらないもの」と評しているように、ナッシュの数学者としての評価を高めたのは、後者の仕事でした。

結局彼は、2つの大きな賞を受賞します。

1994年:ゲーム理論の経済学への応用に関する貢献により、ノーベル経済学賞受賞

映画では、ノーベル賞受賞を人生のゴールとでも言わんばかりに描いていますが、その後彼は、自身も受賞を切望していた(と思われる)数学界で、フィールズ賞に次いで権威のある賞を受賞します。

2015年:非線形偏微分方程式論とその幾何解析への応用に関する貢献により、アーベル賞受賞

つまり、応用的貢献でノーベル賞を、より純粋数学的内容でアーベル賞を受賞したという訳です。
ちなみに、ノーベル経済学賞とアーベル賞の両方を受賞したのは、後にも先にも彼だけです。

しかし、統合失調症も寛解し、アーベル賞を受賞して、穏やかな老後を過ごそうかというまさにその時、彼の人生はあっけなく幕を閉じます。

2015年5月23日。
アーベル賞授賞式の後、空港から自宅へ向かう帰路で、夫妻が乗っていたタクシーが事故を起こし、2人は死亡します。
なんということでしょう。
しかも、帰りの飛行機を5時間早い便に変更した関係で、予約していたリムジンが来ず、やむなく乗ったイエロー・キャブの運転手が転業したての素人だったので事故った、というから、何とも言葉を失います。

本当に欲しかった「数学界からの称賛」を得た途端、天に召されてしまった彼の人生は、映画より劇的だった、と言うべきかもしれません。

 

ゲームの理論におけるナッシュの功績

せっかくですから、ナッシュの功績を讃え、ゲームの理論を易しく解説しておきましょう。

ゲームの理論とは、複数のプレイヤーの行動や意思決定を分析する理論のことです。
本来、厳密に数式を使って説明するのですが、だいじょうぶ。
簡単なモデルなら難しい数式は使わずにかなり正確に理解できますので、説明しましょう。

理解するべきキーワードは、以下の3つです。

  • 囚人のジレンマ
  • ナッシュ均衡
  • パレート最適

では順番に見ていきましょう。

「囚人のジレンマ」モデル

ある軽犯罪(懲役2年相当)の共犯で捕まった、2人の囚人A・Bがいます。
その2人には、より重い犯罪(懲役5年相当)の容疑があり、検事はその2人に自白させるため、次のように話しました。ちなみに、取り調べは別々の部屋で行われ、2人の談合(協力し合うこと)は許されていません。

  •  重犯罪についてもし2人とも黙秘したら、証拠不十分で重犯罪についての罪には問えないので、軽犯罪の「懲役2年」が課せられる。
  •  重犯罪について片方だけが自白した場合は、そいつを釈放する(つまり懲役0年)。そのかわり黙秘した方は、懲役10年だ(つまり2人分の罪を1人がかぶる)。
  •  重犯罪について2人とも自白した場合は、2人とも懲役5年だ。

2人の囚人A・Bの戦略(行動)と懲役の関係を表にまとめると、以下のとおりです
(これを利得表と呼びます)。

表内の (-a, -b) は2人の囚人A・Bの懲役がそれぞれa年、b年であることを意味しています(ちなみにマイナスをつけているのは、懲役は損だからです)。たとえば表の右上の欄(-10,0)とは、「Aが黙秘し、かつBが自白した場合、Aの懲役は10年、Bの懲役は0年」を意味します。

ナッシュ均衡

A・Bは、どのような行動(戦略)を採るのが得か、論理的に考えてみましょう。
これを数学的には、最適反応と言います。
つまり、相手がある戦略をとったという条件の下で、自らの利得を最大化する戦略を考える、ということです。

具体的に、まずAの立場にたって考えてみましょう。

  • Bが「黙秘」した場合(利得表の左列):自分 (A) の懲役は、黙秘すれば2年、自白すれば0年である
    →だから自白した方が得だ!
  •  Bが「自白」した場合(利得表の右列):自分 (A) の懲役は、黙秘すれば10年、自白すれば5年である
    →だから自白した方が得だ!
  •  えっ、てことはどっちにしても(Bがどの戦術をとっても)自白するのが得じゃん(利得表の下行)

ということになります。

Bの立場でも全く同様なので、Bも(Aがどの戦略をとっても)自白するのが得、ということになります(利得表の右列)。

このように、協力しない者が利益を得る状況(チクれば無罪放免)では、互いに協力しなくなり、利得表では右下(AにとってもBにとっても、最適反応は「自白」)に落ち着きますね。
この場所をナッシュ均衡と言います(ナッシュの1950年の論文で論じられた均衡点のことで、彼の功績を讃えてそう呼ぶようになりました)。

ナッシュ均衡は、各プレイヤーの最適反応の組合せです。
言い方を変えれば、自分だけ戦略を変えると損をしてしまう状況が全プレイヤーで起こっている膠着状態とも表現できます。
また、各プレイヤーが論理的に考えた先に行きつく場所なので、ゲームの解とも呼ばれます。

ナッシュ均衡はパレート最適ではない

しかし、奇妙なことに気づきませんか。
利得表でも明らかなとおり、A・B双方にとって得なのは、左上の「両者ともに黙秘」の場合ですよね。
つまり、ナッシュ均衡が必ずしも最適解ではないのでは?ということです。
もう少し詳しくみてみましょう。

ナッシュ均衡の場所(右下)から、A・Bともに損をせず、少なくともA・Bどちらかが得するように状態を変化させることができるか、考えてみます。
右下から左上に行くと、A・Bともに得します。
このような時に、右下から左上には、パレート改善が可能だといいます。
つまりパレート改善は、どのプレイヤーからも文句が出ず、少なくとも1人のプレイヤーが得をする状態の変化のことを指します。
最終的にこれ以上パレート改善できない状況まで行きついた状態を
パレート最適 or パレート効率化と呼びます。
つまり、左上はパレート最適ということです。

【補足】
実は、右上と左下も、数学的には「パレート最適」です(これ以上パレート改善できないことを、確かめてみてください)。
つまりこの囚人モデルでは、パレート最適の状態は3箇所ある、ということになります。
ただ、A・Bの量刑(懲役年数)の合計が最小となるのは左上なので、上記では左上だけを「パレート最適」と取り上げています。

状況をまとめましょう。

囚人にとって、「互いに自白」して5年の刑を受けるより、「互いに黙秘」して2年の刑を受ける方が得です。
しかし、A・Bがそれぞれ自分の利益を追求し論理的に身の処し方を考えると、「互いに自白」という結果になってしまいます。
これが「ジレンマ」と言われる所以です。

言い方を変えると、「利得を争うゲームにおいて、ナッシュ均衡(ゲームの解)は必ずしもパレート最適ではない」と言うことができます。
「囚人のジレンマ」という言葉の印象だと、非常に特殊な場合を考えているように思えるかもしれませんが、これは結構な場合に当てはまる非常に有用なモデルです。

例えば、同じ商品を提供する2社(A社とB社)が居たとして、価格競争をすることを考えてみましょう。
ある日、A社がB社を出し抜いて価格を下げたとします。
すると、B社のシェアはガタ落ちし、A社は大儲けしますね。
ところがB社も手をこまねいて傍観している訳はなく、追従値下げに踏み切ることは必定です。
すると、昨日までの価格から、一段安い価格に落ち着くことになります。
つまり、果てしない価格競争というナッシュ均衡に向けて、両者ともに転がり続けることになります。
余談ですが、こういう消耗戦を避けるために、企業同士が価格カルテルを結んだりしたがる、ということですね。
もちろん価格カルテルは公正な市場競争を阻害しますので、それを禁止するために独占禁止法が設けられている、という訳です。

また、ちょっと気持ちのいい例ではありませんが、いじめの構図もこれで説明がつきます。
みんながいじめなければいいのですが、1人のプレイヤーがいじめを始めると、他のプレイヤーは、いじめに加担しない場合の損が大きい(自分が新たないじめの対象になってしまう)ので、いじめに加担する戦略をとらざるを得ません。
かくして、プレイヤー全員がいじめに加担するという「ナッシュ均衡」の地獄絵が実現してしまう訳です。

このように、各個人が合理的に選択した結果(ナッシュ均衡)が、社会全体にとって望ましい結果(パレート最適)にならない「社会的ジレンマ」とも呼べるような状況は、とても沢山あります。
少し、探してみてください。

やや強引なまとめ

ちょっと、お話があっちこっちに飛びましたので、多少強引ですが、この記事をまとめておきます。

  • 「ビューティフルマインド」は名作なので、未見ならば是非ご覧ください
  • ナッシュは数学者であるが、ゲームの理論においても優れた業績を挙げ、ノーベル経済学賞に輝いた
  • 数学は、実生活やビジネスの現場にも役立つ「実利的な学問」である
  • 囚人のジレンマにあるように、個人の最適反応の組合せである「ナッシュ均衡」は、社会全体として望ましい「パレート最適」と一致しないことが多い

Follow me!

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA