どちらが有利? じゃんけんで学ぶ「ゲーム理論」
桜美林大学教授 芳沢光雄
勝負の場で最良の結果を残すにはどうすればよいのか。数学でもいくつか比較・検討する方法がある。例えば、ルーレットやサイコロなどの賭博は偶然性のみが支配している。この場合は確率で論じることができ、17世紀に研究が確立されている。では相手が人間だったらどうなるのか。人の意志が介在する場合の戦略・戦術を考えるのが「ゲーム理論」だ。研究が確立したのは20世紀のことで、ビジネスや国際政治など様々なところで使われている。ゲーム理論の初歩について、じゃんけんを使って考えてみよう。
戦況の分析などに応用
まず、昔からゲーム理論の対象としてよく取り上げられる戦況・戦術分析について説明したい。代表的な例に、太平洋戦争時、日本軍が連合軍に壊滅させられた「ビスマルク海海戦」がある。
日本軍は島の東側から西側まで物資を運ばなくてはならない。島の南側を通過する場合は晴天で連合軍に発見されやすく、長時間の爆撃を受ける。一方、島の北側を通る場合は雨天で発見されにくく、発見されても短時間の爆撃になる。日本軍は北側を選んだ。しかし、連合軍も同じ判断から偵察機を北側ルートへ向かわせた。多数の敵機が超低空から攻撃を仕掛け、日本軍の輸送船はすべて、沈没したのであった。
日本軍の作戦は間違っていたのか。ゲーム理論では、日本軍が北側を選んだ場合・南側を選んだ場合、連合軍の偵察機が北側を選んだ場合・南側を選んだ場合、合わせて4つのケースに分け、想定される被害などを検討する。ノルマンディー上陸作戦のゲーム理論の分析もよく知られている。
グーとパーだけのじゃんけんで勝負
ではじゃんけんを使って、ゲーム理論について説明しよう。一般のゲーム理論では、戦術としての選択肢はいくつでも構わないが、今回は選択肢が2つの例で解説する。
人間同士の勝負事の最終段階では、左か右、前進か後退、のように2つを1つに絞ることが往々にしてある。野球でも、直球かフォークボールのどちらに的を絞るか、という判断が勝負の分かれ目となることがよくある。AとBの2人は自分の意志でグーまたはパーを出し、それぞれの得点は表1のように定める。一見、Bの方が有利に見えるが、冷静に考えてみよう。なお、実際にこのゲームを楽しむ場合は、一定の時間を設けて何回か繰り返すと面白いだろう。以下の議論は、1回行う場合として考えている。
いま、Aがグーを出す確率をx(0≦x≦1)、Bがグーを出す確率をy(0≦y≦1)とする。1回のじゃんけんにおけるAの得点期待値をα、Bの得点期待値をβとすると、
α=0×A・Bともグーを出す確率+3×Aがグー・Bがパーの確率+3×Aがパー・Bがグーの確率+0×Aがパー・Bがパーの確率
=3×x×(1-y)+3×(1-x)×y
β=6×A・Bともグーを出す確率+0×Aがグー・Bがパーの確率+0×Aがパー・Bがグーの確率+1×Aがパー・Bがパーの確率
=6×x×y+1×(1-x)×(1-y)
である。ここでα=β、すなわちAとBが互角になる状況とはどのようなときであろうか。式を変形していくと、以下のようになる。
ここで復習であるが、面積12平方センチの長方形について、たてをxcm、横をycmとすると、
xy=12
という式が成り立つ。これはxとyが反比例していることを示し、xとyが正の範囲でそのグラフを描くと、図1のような双曲線になる。
そこで、表1から導いた式
のグラフは、xy座標平面上で
のグラフをx軸の正の方向に4/13、y軸の正の方向に4/13、それぞれ平行移動させた図2のような双曲線になる。ここで、確率は0以上1以下であるから、0≦x≦1、0≦y≦1となることに留意しよう。
グラフを説明すると、4点(0、0)(1、0)(1、1)(0、1)で囲まれた正方形の部分において、AとBが互角になるのは双曲線上、ということである。
ここで、点(1、0)(0、1)が何を意味するか考えよう。表2の2段目と3段目のケースだ。明らかにAが有利である。一方、点(0、0)(1、1)は表2の1段目と4段目に当たり、Bが有利である。それゆえ、双曲線に挟まれた部分ではAが有利となり、双曲線の外側ではBが有利となる。
とくにx=4/13において、すなわちAが確率4/13でグーを出すときは、つねにAが有利なのである。必ず勝つというわけではないが、このゲームはAが有利なものであることを意味している。例えば、事前にハートだけのトランプ13枚から無作為に1枚を取り出し、それがエース、キング、クイーン、ジャックならばグーを、その他ならばパーを出せばよい。第一印象では「B有利」にも思えたが、ゲーム理論によると結果は正反対なのである。
ところで、ここまでの内容は著書「新体系・高校数学の教科書(上)」で述べたことである。実は、グラフ上の点(4/13、4/13)はゲーム理論で「鞍点(あんてん)」という重要な点である。
次の図のように、グラフにすると馬具の鞍(くら)のように見えることから、この名が付いた。ゲーム理論では、双方の思惑が均衡するような点を指す。
ゲーム理論の「鞍点」の意味とは
では、その意味を別のグラフを使って説明しよう。
グラフを描く前に、表1のゲームを本質的な意味が変わらないように、変形する。AをXに、BをYにそれぞれ取り替えて(確率のxとyは同じ)、得点は表2のようにYからXへ与えるゲームとする。
表2で、-6点をYからXに与えることは、Yの持ち点は6点上がり、Xの持ち点は6点下がることになる。得点差は12になる。また、3点をYからXに与えることは、Yの持ち点は3点下がり、Xの持ち点は3点上がることになる。得点差は6になる。
その結果、グーとグー、グーとパー、パーとグー、パーとパーそれぞれの手が出た後の得点差はすべて、表2は表1の2倍になるだけであり、本質的には同じゲームである。
さらに、表2を一般化させて
と表してみると、以下の4式が成り立つ。
さて、XはYから与えられる点を多くしたいのであり、YはXへ与える点を少なくしたいのである。そこでXは、Yがグーとパーのどちらを選択しても、その両方を満たす状況でzが最大になるようにxを定めたいとしよう(ゲームでの行動基準)。これは(3)と(4)から、
を満たす範囲でzが最大になるxを定めればよいのである。そこで図3より、x=4/13のとき、zは最大3/13になる。
一方Yは、Xがグーとパーのどちらを選択しても、その両方を満たす状況でwが最小になるようにyを定めたいとしよう(ゲームでの行動基準)。これは(1)と(2)から、
を満たす範囲でwが最小になるyを定めればよいのである。そこで図4より、y=4/13のとき、wは最小3/13になる。
上で注目したいのは、期待値zの最大値と期待値wの最小値が等しいことである。その等しい値が正の数3/13になるので、Xの方が有利と言えるのである。(もし負の数になっていたら、YからXへ負の数を与えることになり、Yが有利となる)。
上で述べたことを一般化させたものに、「ゲーム理論のミニマックス定理」というものがあり、上でzの最大値とwの最小値が等しいことと同じ性質が、この定理で成り立つ。ミニマックスとは、最も悪い(マックス)事態が発生したときの損害が最も小さく(ミニ)なるように判断を下す方法のことである。
ちなみに、その等しい値を決定する図2における(4/13、4/13)のような点が、ゲーム理論の鞍点なのである。両者がそれぞれ最善として選んだ戦略が均衡する点である。
最後に、大学の一般教養の数学について述べたい。現在、微分積分と線形代数(行列やベクトルなど)が主要科目になっているところが多い。実は、これは戦後のことであって、戦前は微分積分だけであった。
なぜ、戦後に線形代数が加わったのだろうか。それは、第二次大戦の敗因に、線形代数も関係していたからである。今回説明したゲーム理論は線形代数を基礎としており、冒頭の例のように戦況・作戦分析などに使われる。線形代数の応用として、軍事物資の輸送問題などに使われる線形計画法もある。いずれもビジネスの場でも応用できるので、大学の一般教養で基礎をしっかり学んでおこう。