意思決定:ゲーム理論序論その2―「囚人のジレンマ」非協力ゲームにおけるナッシュ均衡かつ非パレート最適の選択

囚人A 囚人B 協力(妥協) 裏切り(自白)
協力(妥協) (1,1) (3,0)
裏切り(自白) (0,3) (2,2)

ゲーム理論における非協力ゲームの代表的な例がこの「囚人のジレンマ」である。ゲームの内容は次のようである。

(1)AおよびBが軽犯罪でつかまり処罰される。自白をさせるために別の部屋で証言させる。
(2)AにもBにも妥協して協力・協調するとなると減刑(1年禁固刑)して両方とも処罰すると伝える。
(3)ただし、さらにこの司法取引には条件があると持ち掛ける。その条件とはこうだ。
(4)片方が自白した場合、そのほうを釈放し、自白しなかったものを重罪(3年禁固刑)にする。
(5)双方が自白したら、ともに処罰をして(1)よりも重罪で(4)よりも減刑して処する(2年禁固刑)。

これを利益表にしたものが次である。これは上図を発展させた図である。

囚人A 囚人B 協力(妥協) 裏切り(自白)
協力(妥協) (-1,-1) (-3,5)
裏切り(自白) (5,-3) (-2,-2)

なぜこういう利益表になるのかを説明すると…

・まず、釈放は5となっている。利益表の中で最大のメリットである。
・禁固3年は-3となる利益表にしている。これはより禁固1年2年よりも重い。
・禁固1年は-1の利益表としている。3年の場合(-3)よりも利益である。
・禁固2年は-2となっており、3年(-3)よりも利益であり、それながら1年(-1)よりも重い刑罰。

よってこの利益表は妥当である。なおこの利益表の各数値はマトリクスの場所ごとに-3<-2<-1<5となるような不等号で表される限り、どの数値をとっても問題はない。利益表を作るとき、問題なのはそのままの数値を入れてはいけず、どこがどれだけ損得関係にあるのかということを明確にすることにある。

さて、このときに非協力ゲームにおけるナッシュ均衡となる点は…というとその前に条件を占めそう。

Aはこう考える。

・Bが協力(妥協)した場合、Aの利益となる選択肢は裏切り(自白)である。
⇒なぜなら利益表より-1<5だからだ。
・Bが裏切った(自白した)場合、Aの利益となる選択肢もまた裏切り(自白)である。
⇒同じく-3<-2だからだ。

しかしながらこの時にBもまた逆にAと同じように考えているのである。

要するに両方とも裏切ることになる(自白する)のである。つまり、囚人のジレンマの非協力ゲーム理論におけるナッシュ均衡点はA・B双方ともに裏切ることである。ただし、この場合このナッシュ均衡点はパレート最適ではないことに注意すべきである。それはパレート最適とは、パレート的改善が不可能な場合のことだからである。要するに相手に迷惑をかけずに自分の利益を高めようとする行動のことをパレート的改善というからである。

A・Bとも裏切り(自白)を選ぶ以外(3つのマトリクス部位)はパレート最適である。逆に言えば、ナッシュ均衡点である裏切り・裏切りはパレート最適でない。なぜならパレート的改善(相手に迷惑させず自分の利益最適なものを選ぶこと)が見込めないのは、A・Bどちらかが協力(妥協)したときだからである。ゆえにパレート的改善が見込めない場合のことをパレート最適というのであるからして、どちらかが協力(妥協)した場合、その時点でパレート最適である。

複雑な論理だがこの条件は様々な社会に現れる、汎用性のあるジレンマである。それは各個人がよりよい行動をしたとき(ナッシュ均衡点が生じるとき)にその結果として全体にとって望ましくない状況を作るから(パレート最適でない状況を作るから)である。このことを「社会的ジレンマ」ともいう。

marikoi

ここの主筆・共同管理人。ぶっちゃけ狂人。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA