靖国神社と囚人のジレンマ、主人と奴隷の戦略、自分の為に生きること

囚人のジレンマ

「囚人のジレンマ」というゲームでは、「しっぺ返し戦略」や「パブロフ戦略」など「協調的」な戦略が有利であることはよく知られています。ところが、2004年に行われた大会で優勝したのは、まったく異なる戦略でした。今日は、世界をもうちょいマシにする方法を考えます。

「寒いね」と話しかければ「寒いね」と答える人のいるあたたかさ

俵万智『サラダ記念日』より

理屈ぬきで共感できる歌ですね。個人的に、俵万智の歌の中でも最も好きな歌の一つです。

さて、今日は、まず次のような主張から始めたいと思います。すなわち、この歌で行われているような、相手のアクションをただ「オウム返し」するだけのコミュニケーションは、対人関係において非常に有効である。いや、そればかりか、「最強」の戦略である、と。

何を言ってるんだお前は、「最強」とかいう問題なのか? という感じですけど、まずは、この主張を「囚人のジレンマ」というモデルを使って考えてみたいと思います。この時点で、「あー、はいはい」という人もいらっしゃると思いますが、うん、まあ、ご想像通りの話なんですけど、一応最後まで読んでくれると嬉しいです。たぶん、あんまり知られていない話もしますんで。

さて、「囚人のジレンマ」については、Wikipediaに解説がありますが、一応簡単に紹介しておきます。

まず、「囚人のジレンマ」は2人で行うゲームです。あなたと対戦相手は、「協調」と書かれたカードと「裏切り」と書かれたカードを、それぞれ1枚ずつもっています。んで、「いっせーの!」でどちらかのカードを場に出します。カードの出方によって、あなたと相手にそれぞれ得点が入ります。

右上の画像が得点表です。細かい数字には、あまり意味がありません。大ざっぱに言うと、次のような感じになります。

  • 2人とも「協調」カードを出したときは、2人とも得をする。
  • 一方が「協調」したのに、もう一方が「裏切り」だと、裏切った方は大きく得をするが、裏切られた方は大損する。
  • 両方とも「裏切り」だと、2人とも損。

こういう設定は日常生活でも実によくあるかと思います。例えば、2国間関係で、「協調」を「軍縮」、「裏切り」を「軍拡」で考えてみれば分かるでしょう。軍事バランスが崩れれば、戦力の強いほうが圧倒的に有利ですが、だからといってお互いに軍拡競争やってたら、軍事費がかかって仕方がない、みたいな感じです。

で、このゲーム、いったい何が面白いのか? まず、このゲームを1回だけ行うとして、どういう戦略が有利か考えてみます。結論は簡単です。「裏切り」ですね。だって、相手がどっちのカードを出したとしても、自分は「裏切り」を選択したほうが得なんですから、考えるまでもありません。人を見たら泥棒と思え、渡る世界は鬼ばかり、ですよ。

では、このゲームをくり返し行って得点を競うことを考えます。そのときも、やっぱり裏切りまくったほうが有利なのでしょうか? そうではありません。「裏切り戦略」は、1対1の勝負では絶対に負けることはありませんが、総合得点が伸びないんですね。

アクセルロッドという研究者は、世界中のゲーム理論の研究者たちからさまざまな戦略を募集して、この囚人のジレンマを闘わせるイベントを行いました。ネタに困ったら天下一武道会の法則です(違います)。2度、大会が行われ、なんと2回とも同じ戦略が優勝しました。社会心理学者ラパポートの考えた「しっぺ返し戦略」です。

「しっぺ返し戦略」は驚くほどシンプルな戦略です。それは、次のようなルールに従います。

  • まず、1手目は「協調」を出せ。
  • 2手目以降は、相手が直前に出した手と同じものを出せ。

要するに、「寒いね」と話しかけられたら「寒いね」と答えろ、という戦略です。そんなんでいいのかよ! という感じですが、実際そんなんが優勝しちまったわけです。

この戦略の行動パターンは、現実の人間関係においても非常に示唆的です。まず、最初は協調せよ。相手が協調している限り、自分から裏切るな。相手が裏切ったら、即座に報復せよ。でも、相手が反省して協調してきたら、直ちに許せ。

ここで、「しっぺ返し戦略」はその名に反して、非常に「協調的」な戦略であるということに注意してください。

さてさて、この囚人のジレンマを、より現実に近づけてみます。「協調」カードを出しても、一定の確率で「裏切り」カードに変わってしまう、というルールをつけてみましょう。要するに、メッセージが「誤解」されちゃう場合です。自分では「君のその服、とてもにあうよ」と言ったつもりなのに、いつのまにか「君のその服、とてもにおうよ」とかに変わってるわけです。恐ろしい世界です。

この世界では、しっぺ返し戦略は最強ではありません。なぜかというと、しっぺ返し戦略同士の戦いで、いったん「誤解」が発生して「裏切り」カードが場に出てしまったとたん、相手が報復→それに対して自分が報復→それに対して相手が……という報復の連鎖が起こり、得点が落ちるからです。

ここで登場するのが「パブロフ戦略」です。パブロフ戦略は、直前の戦略がうまくいっているならそれをくり返し、うまくいっていないなら反対の戦略に変える、というものです。具体的には、お互いに「協調」、あるいはお互いに「裏切り」だったときは、次の手は「協調」になり、そうでないときは「裏切り」を出します。たぶん、ほとんどの人が今の説明を読みとばしたと思います。確かになんだかよく分かりません。具体的に考えてみます。

パブロフ戦略同士の戦いで、「誤解」が発生したとします。場には「協調」カードと「裏切り」カードが出ている状態です。その次の手がどうなるか考えてみましょう。「協調」カードを出したほうは、相手に出し抜かれたかたちですから、作戦を変えます。ですから次は「裏切り」。一方、「裏切り」カードを出した(正しくは、出てしまった)ほうは、とりあえずうまくいったので、この作戦を続けます。次も「裏切り」です。

というわけで、次の手は「裏切り」対「裏切り」です。ダメじゃん、という感じですが、さらに次を考えてみます。

パブロフ戦略では、「裏切り」対「裏切り」になった場合、「うまくいっていない」と判断して、手を変えるのです。すなわち、次の手はお互いに「協調」です。要するに、速攻で仲直りできる戦略なんですね。

というわけで、誤解が発生する状況では、「パブロフ戦略」は「しっぺ返し戦略」より強くなります。しかし、考えてみると、これは驚異的です。例えば、「パブロフ戦略」対「常に裏切り戦略」の戦いを考えてみてください。少し考えれば分かりますが、パブロフのほうが「協調」と「裏切り」を交互に出す戦いになりますよね。ボロ負けです。

パブロフ戦略は、どんなに状況が悪化しても「仲直りしましょ?」と呼びかける戦略なのですが、それが通じない相手(例えば「常に裏切り戦略」)には、まったく勝てません。ところが、そんなお人好しの戦略が最強なのです。

実は、しっぺ返し戦略も似たようなものなのです。彼らは、1対1の戦いではほとんど勝てません。ところが、どちらも非常に協調的な戦略なので、相手に花をもたせつつ、自分もしっかり得点を稼ぎます。よって、トータルの得点では、最強になってしまうのです。

これは現実世界に応用したとき非常に教訓的な話です。例えば、国際関係においては、1国対1国の利害では多少損をしたとしても、協調的な戦略をとったほうが、多国間関係においては有利であるかもしれない、ということです。

私が、この話題を書くきっかけになったのは、数日前に、小泉首相が「終戦記念日に靖国参拝」というカードを切ったことです。調べてみると、「靖国問題」に「囚人のジレンマ」を応用して考える、というのは、既に去年の参拝のときに「木走日記」さんが「世にも不思議な「靖国のジレンマ」〜ゲーム理論からの一考察」というエントリを書いて行っていました、さすがという他ありません。このエントリはコメント欄も含めて読みごたえがあります。*1

ただし、現実世界にゲームの理論を応用するのは簡単ではありません。例えば、靖国問題において「協調」カードは何なのでしょうか? 日本の場合は、「靖国参拝をやめること」なのでしょうか? では、中国の「協調」カードは? 「靖国参拝に文句を言わないこと」なのだとしたら、この設定では、協調カードを同時に場に出すことができなくなってしまいます。

それはともかく、しっぺ返し戦略や、パブロフ戦略といった「協調的」な戦略が「囚人のジレンマ」というゲームにおけるある意味「最強」の戦略(きちんと言うと、ナッシュ均衡解)である、ということは、数学的にきちんと証明されています(フォーク定理)。

さて、ここで話が終われば、ラブ&ピース、人類みな兄弟!という感じで、非常にめでたいのですが、しかし、実は本題はここからです。

2004年の10月に「囚人のジレンマ」誕生20周年を記念して大会が行われました。そこで、優勝したのは、なんと「しっぺ返し戦略」でも「パブロフ戦略」でもありませんでした。ニック・ジェニングズ教授の考えたまったく新しい戦略が優勝したのです。ネタに困ったら転校生の法則です(違います)。

その戦略を、とりあえず「主人と奴隷」戦略と名づけましょう(正式な名前ではありません)。この戦略はグループをつくることで初めて威力を発揮します。この「主人と奴隷」戦略に従って行動するグループは、「主人」を担当するプレイヤーと「奴隷」を担当するプレイヤーに役割を分担します。

彼らは、まずゲームの序盤に「協調」カードと「裏切り」カードを、モールス信号のようにある決まった順番で出すことで、対戦相手が自分と同じグループかどうかを識別します。そして、相手が自分の仲間ではない、敵であると判断した瞬間、「常に裏切り戦略」をとります。つまり、ヨソ者には徹底して敵対的な行動をとって、他人の足を引っぱるわけです。

では、対戦相手が同じグループだったらどうするのでしょうか。この作戦のポイントは、自分が「奴隷」で、相手が「主人」だった場合にあります。このとき、「奴隷」は「常に協調戦略」を、「主人」は「常に裏切り戦略」をとるのです。要するに主人は奴隷から搾取しまくるわけです。こうすると「奴隷」の得点はガタ落ちになりますが、それでかまわないのです。これは「主人」を優勝させるための戦略なのですから。

これは、自転車競技でいう「エース」と「アシスト」の関係によく似ています。自転車は空気抵抗が大きいため、集団の先頭を走るのは不利です。そこで、チーム内に「エース」と「アシスト」という役割分担を決め、「アシスト」たちが交代で先頭を走って「エース」をひっぱり、ゴール直前で体力を温存していた「エース」が飛び出すのです。

しかし、なんだかズルイ話です。「囚人のジレンマ」は出すカードによって得点が決まっていたわけですが、「奴隷」たちの行動はその得点を無視しています。彼らは、「主人を大会で優勝させる」という、まったく別の目標に向かってプレイをしているわけです。いわば、彼らがプレイしているのは「囚人のジレンマ」ではなく、別のゲームであるわけです。

実際、ネットで検索しても、この2004年大会の話題が出てくることは、ほとんどありません。一つには、上記のような「ズルイ」という感覚があるものと思われますが、私は、もう一つの理由もあると思います。それは、この作戦が「教育的」でない、ということです。

「しっぺ返し」戦略や「パブロフ戦略」の行動パターンは、非常に「教育的」です。まず協調せよ。相手をすぐ許せ。裏切りあう状況は打開せよ。うんうん、いいですねー。

ところが、この「主人と奴隷」戦略は、なんなんですかこれ、話になりません。こんなもの学校で教えられませんよ。「いいかい君たち、ガイジンを見たらすぐ殺しなさい。一人一殺!」とか「御主人様には絶対服従。これテスト出すよー」とか言ってるんですよ。まあ、強引に解釈すれば「チームワークの勝利」なのですが、あまりにも排他的な戦略です。

しかし、私は思うのですが、これもまた現実なのです。つまり、世の中には、「主人」のために自分を殺す連中もいるってことです。他人が見ると何を考えてるのかさっぱり分からないわけですが、ある特定のプレイヤーのために、自分の得点を無視して行動するやつがいる。まあ、各自の思想信条に従って適当に具体例を考えてください(中国と朝日新聞とか、ブッシュとコイズミとか)。

「主人と奴隷」戦略が優勝してしまった。私は、このことは事実として、ちゃんと考えなきゃいけないと思います。

オリジナルの「囚人のジレンマ」は、ある意味ものすごく利己的なゲームでした。それぞれのプレイヤーは自分の得点しか考えていませんでした。ところが、その条件のもとでは「協調的」な戦略が最強になったのです。

一方で、チームをつくって優勝を競う2004年大会では、「自分を捨てて他人のために尽くす」ことが優勝するための秘訣でした。ただし、この場合の「他人のため」の「他人」というのは、「自分と同じグループに所属する他人」ですけどね。で、結果として、「排他的」な戦略が最強になってしまいました。

なんとも逆説的な結果ですね!

私は、この結果には、世界がどうすれば今よりマシになるか、という問題の一つのヒントがあるように思います。幸福の総量(得点の合計値)は、明らかに「協調的」な戦略を取ったほうが大きくなります。「寒いね」と答える人のいるあたたかさ、です。では、その「あたたかさ」を手に入れるためには、いったんどんなルールが必要なのか……。

とはいえ、それについて具体的に考えるには、ちょっと力が尽きました。今日はここまでとして、いったんキーボードから離れたいと思います。

*1:ただし、木走日記さんのエントリは「パレート最適」という言葉の使い方が少し不適切です。「囚人のジレンマ」における「パレート最適」は「協調-協調」だけではありません。「協調-裏切り」「裏切り-協調」も「パレート最適」です。誤解を招く書き方だと思います。