「利他行動を支えるしくみ」


本書は山岸門下の社会心理学者真島理恵による,間接互恵的利他性の成立に関する本である.体裁は一般書だが,非常にナローなエリアに掘り下げた内容であり,かなり特殊な専門書といってよいだろう.*1


本書の内容に触れる前に,ヒトの利他行動を進化生物学的視点から見た説明を整理しておこう.(なお本書でもそれまでの学説の流れが社会心理学サイドから見た視点で整理されている)

  • 進化生物学的には利他行動は当該個体にとって不利に見えるので特別な説明が必要になる.このような説明には,ハミルトンによる血縁淘汰・包括適応度的な説明,トリヴァースによる互恵行動的説明がスタンダードなものだ.
  • しかしヒトの行動を観察すると,それでは説明できない一般的な利他的な傾向がある.これを説明しようとして昨今注目されているのが,「間接互恵性」による説明だ.
  • 間接互恵性による説明とは,簡単に言うと,「他人に利他行為を行う人は『良い人』だという評判が立つ.ここで『良い人に対しては利他行為を行う』という行動規範が広まっていれば,別の他人から利他行為を受けやすくなる.その結果最終的には利他行為を行う方が利益を得られる」という説明である.
  • しかしこのような状況は単純なモデルでは実現しない.というのは無差別に利他行為をする戦略「allC」は,常に裏切り戦略「allD」の侵入を受けてしまう.だから支配的間接互恵戦略は,何らかの形でallDに対して不利な扱いをし,allDの侵入を防ぐようなものである必要があるが,そのような戦略は(特に認知コストがあるとするなら)allCの侵入を防げない.つまり間接互恵候補戦略はまずallCに対してESSになり得ず,allCが増えた後は最終的にallDに侵入されてしまうという結果になるからだ.
  • これを避けるためには,何らかの形で系に振動を与えなければならない.認知エラー,行動エラー,戦略の突然変異率あたりを高めてやると,この状況から抜け出せる可能性が出てくる.
  • またモデルを考える際にはこのほかに様々な細かい設定がある.戦略の複雑性に応じた認知コストを考慮するか,一般交換状況(与え手と受け手として非対称に対戦し,与え手は対戦相手に一方的に与えるかどうかを決めるだけのゲーム「ギビング・ゲーム」を行う)なのか,社会的ジレンマ状況(囚人ジレンマゲームを対戦する)なのか,対戦は完全ランダムか,相手を選択するオプションがあるのか,「評判」というラベル情報を用いるのか,などだ.私の理解では,この手のモデルはこれらの条件によって様々な挙動を見せ「悪魔は細部に宿る」という状況に近いものになっている.


ここまでが本書の書かれた背景だ.本書ではこの中で,認知コストは無視,一般交換状況,エラーと突然変異を与えて間接互恵性が生じうるようにした状況を前提としている.また「評判」というラベル情報は用いずに,「前回与えたか」(1次情報)「その相手は前回与えていたか」(2次情報)・・・という過去の選択肢の情報のみを扱っている.


本書の記述は大きく理論編と実証編に分かれていて,理論編ではモデルを論じ,実証編では心理学実験,アンケートの結果を扱っている.この両方扱っているところは本書の特徴の1つだ.


まず理論編.
本書ではまず,ヒトの利他行動を説明するに当たって,適応的なアプローチをとり,究極因を説明するスタンスだと宣言している.これは社会心理学者としてまずはっきりさせたいところだったということだろう.もっとも適応的なアプローチをとるといいつつ,これが遺伝的な基礎を持つものである必要はなく,学習などによるものでも良いとしている.もちろん学習でもいいが,その場合にはなぜ経済的に利益を受けた戦略が次世代で頻度を増やすのかをきちんと説明できなければならないだろう.ここは結構難しいところだが本書ではあまり考慮されていない印象を受ける.


また方法論として,単にESSかどうかを問題にするだけではなく,候補戦略が低頻度状態から支配戦略になれるかどうかの動的な挙動も問題にしたいといっている.その意気込みは買いたいが,実際には候補戦略,allC,allDの3つの戦略の優劣を見ているだけで,異なる候補間で何が生じるかは見ていない.最初の取り組みとしてはいいが,やや風呂敷を広げすぎた印象はある.


さて本書ではこのような前提で様々なシミュレーションを行った結果,間接互恵性を成立させ,かつ動的に支配戦略になれる戦略は,ランダムマッチング状況でも,選択的プレイ状況でも以下のようなものであると結論づけている.


本書における間接互恵性成立戦略

T1:与える T3:拒否
T2:拒否  T4:*(どちらでも良い)


ただし
T1:前々回の対戦で与えた相手に対し前回与えたものと対戦した場合
T2:前々回の対戦で拒否した相手に対し前回与えたものと対戦した場合
T3:前々回の対戦で与えた相手に対し前回拒否したものと対戦した場合
T4:前々回の対戦で拒否した相手に対し前回拒否したものと対戦した場合

以降この戦略を以下のように表記しよう
   ○×
   ×*


このように表記するとすると本書で現れる各戦略は以下の通りとなる

  • IS

   ○×
   ○×

  • STAND

   ○×
   ○○

  • SDISC

   ○×
   ××

  • ES

   ○×
   ×○



真島はこれをもって,間接互恵的利他性が成立するための重要な条件はT2の拒否(つまりSDISCかES)であり,これは悪人を助けるお人好しを罰することによりallCの侵入を防ぐ効果があるためであると説明している.(なお実際の至近的心理メカニズムはこれと異なっていてもよく,実際に異なっているようだという説明が実証編にある)


これは大槻・巌佐の先行研究の結果
   ○×
   *○
と異なっている.*2


大槻・巌佐のシミュレーションは「評判スコア」を用いているところ,ESSに絞って検討しているところが本書の分析と少し異なっている.彼等は「悪人をパニッシュする行為」を「善」とする評判こそがallDを不利にできるのであり,間接互恵的利他性を成立させるために重要であると論じている.

真島はこの結果の差は認知エラーのしくみが異なるためであると分析している.大槻.巌佐の結果は認知エラーが集団全体で共有されるのに対して,真島のモデルでは個人により異なる認知エラーを前提にしており,それによる差だとしている.
それは確かにその通りかもしれないが,実は真島の前提とする認知エラーも,相手の属性を間違えるというある特定のタイプのエラーのみを問題にしているように思われる.相手の行動を認知し損ねるというエラーであればまた結論は異なってくるだろう.


さらに真島はこれをもって実際の社会においてどのようなエラーがありやすいのかについて生物学者が鈍感であると批判しているが,私はこの批判はやや勇み足であるように思う.大槻・巌佐は「評判」というラベルを使ってどのような社会規範が利他的な社会を作るかを見ているのであって,その評判が共有されるという前提がおかしいというわけでないと思う.


私の感想としては,このような結果は「モデルの前提がほんの少し異なってくるだけで,結論が大きく変わる」というモデルの挙動を示しているのであって,どちらがよりありそうかだけを問題にするのではなく,より広い前提でどのような戦略がよりロバストであるかが重要だということを示しているのではないかと思う.本書ではまったく触れていないが,「相手によって態度を変える」ための認知コストが少しでもあるとすると,そのコスト不要のallCの侵入を単純に防ぐことは難しく,真島の結論はそのまま維持できなくなるのではないだろうか.*3


また別の論点として,(もともと間接互恵性の理論はヒトの社会にみられる利他性を説明しようとしているのであるが)SDISC戦略はそもそも間接互恵的利他性を実現する戦略なのかという問題があるように思う.本書の中で真島も認めているが,SDISC戦略というのは一度でも拒否した人とかかわった人をみな拒否するという非許容的な戦略であり,これが支配戦略になり,エラーがあれば社会全体はどんどん非寛容なものになっていくだろう.真島はこの問題について選択的プレイ状況では,T4という場合はあまり生じないので,SDISCでもESでも問題ないのだと片付けているが,疑問だ.実際の社会では嫌な相手とも時には関わり合わなければならないという状況が普通ではないだろうか.



さて後半は実証編だ.
ここからは北海道大学の学生相手の様々な実験とその解釈が書かれている.実験は時系列で丁寧に説明されているし,時に被験者と研究者の相手の意図の読み合いのようなところもあって面白い.

実験の結果,真島が強調しているのは,理論編で間接互恵的利他性を成立させるための戦略とされた戦略(T2拒否)は,選択的プレイ状況では現れるが,ランダムマッチング状況では現れないということだ.確かにこの結果は興味深いものだ.

さらに真島は実験時のアンケート調査をもとに,このようなT2拒否をする至近的心理メカニズムも推測している.それは「適切な行為者に報いよう」という心理であり,ことさら「利己的な人を助けるお人好しを排除しよう」とか「そうしなければ自分が罰される」とかいう心理ではないとしている.


これらを合わせた真島の主張は,この心理状態は選択的プレイ状況に対する適応として実装されたものであり,ランダムマッチング状況でこのような結果が得られないのは,それが人間社会で不自然な状況であるからだろうというものだ.さらにここでもランダムマッチング状況を前提としてシミュレーションを行う生物学者の「鈍感さ」を批判している.


これらの実証編の主張も私には強引なものに思われる.
(そもそも私は間接互恵的利他性の成立に真に重要なポイントがT2拒否であるという理論編の結論に落ちていないのであるが,それをおいておくとしても)私の印象では,この選択適応状況だけに現れるというパターンは,選択的プレイ状況では,「意識的戦略」として,「あまり深く考えずに,もっとも疑わしくない相手に与える」というとても安直な行動戦略が可能だったのでそちらに流れた(つまり必ずしも適応的に実装されているとは限らない)ということではないだろうか.もちろんこのような状況が間接互恵的利他性の成立に影響を与えた可能性は確かに興味深いものだが,なお結論づけるには早いだろう.


ここで本書を読みながら私の感じたところをまとめておこう

  • 本書の実験フレームでは1次,2次.(3次)の過去の選択肢状況を示すという形をとっているが,実際の心理状況からは「良い人」「悪い人」という評判ラベルを考えた方が自然ではないだろうか.
  • 実際のヒト社会では完全な選択的プレイ状況が可能になっていることはまれなのではないだろうか.むしろ時には嫌な相手ともやりとりしなければならない状況の方が多いのではないか,そしてそのようなときにどうするかこそ間接互恵的利他性の成立にとって重要であるように思われる.
  • 本書では間接互恵的状況のみの成立を考えているが,実際には直接互恵的状況と結びついている状況がヒトの進化過程では多かったのではないだろうか.両方の状況があり得る中でどのような戦略をとるべきかという形の戦略を考えた方がよいのかもしれない.
  • 実際の社会ではサイコパス,お人好しという戦略が低頻度ながら観察できるように思われる.ということは支配戦略が1つだけあるESS状況を考えるよりも,頻度依存型平衡を考えた方がよいのではないだろうか.


以上いろいろ突っ込みどころもあるが,本書は,間接互恵性について先行研究も紹介しつつ,理論,実験双方から記述され,なかなか深い本に仕上がっている.細部の説明も丁寧でわかりやすいものだ.また最終章では,今後の展望として,一般交換状況だけでなく社会的ジレンマ状況ではどうなるかなどの考察もされており,そこもなかなか興味深い.今後のさらなる知見の積み重ねに期待したい.

*1:価格も税込み7875円とそれに恥じないものだ

*2:大槻・巌佐の先行研究の結果については2004,2006のJournal of Theoretical Biologyの論文が引用されている.その内容はhttp://d.hatena.ne.jp/shorebird/20091225を参照

*3:私の予想としては,大槻たちと真島の双方の条件を満たすESが最もロバストだということになりそうである