意思決定:ゲーム理論序論その3―ミニマクス戦略およびフォークの定理の一歩目

ゼロサムゲームにおいて、次のような意思決定マトリックスを考える(このとき展開ゲームであり、このゲームはさらに完全情報ゲームである)。完全情報ゲームとは対等な情報量の元で使われるゲームであり、不完全情報ゲームとはその逆である。

A B B1 B2 B3
A1 +3 -2 +2
A2 -1 0 +4
A3 -4 -3 +1

これは英語版Wikipediaからの引用および改変利用(図表はAが「受け取る」量を示している)である。この図表は安定的ではないのがポイントである。BがAのことをA2を選ぶと考えていると、Bは最大の利益1を持ちたいとか考えて、B1を選択する。一方で、AがBのことをB1を選ぶと考えているとき、Aは3を得ようとしてA1を選ぶ。そういうわけで双方が意思決定の選択をすることは難しくなってくる。よってより安定的なモデルを必要とする。

このときにAを主体として考えると、A1・A2よりA3を選んだほうが総合的に最大の損害を見込める(-4+-3+1=-6)。一方でBを主体として考えれば、当然(2+4+1=7)だからBにとってはB3が最大の損害となるのでB3を選ばないのが妥当である。よってA3およびB3は考慮しなくていい。ではほかはどうだろうか?A1の確率1/6がであり、A2の確率が5/6とする。すると、Aが1/3より大きい期待値を支払いたくない選択が可能になる。

このときにAの選択にかかわらず、Bの利益の期待値ゲインを考えてみる。確率A1が1/6かつA2が5/6だから、Bを選択者として考えて、表より…

BがB1を選ぶとき、期待値は3×(1∕6)+(-1)×(5∕6)=(−1∕3)
BがB2を選ぶとき、Bの期待値は(-2)×(1∕6)+0×(5∕6)=(−1∕3)

となるので、これ以上の利益はAの選択(A1・A2のチョイス)いかんに関わらず最低限度の利益ゲインをBは見込むことが出来る。これがミニマクス戦略の安定的基盤であり、ここからはもっと最善の解決策を見つけることは出来ない。このように意思決定において、最低限ゲインのポイントを抑えることがこの戦略の寛容な部分となっているわけだ。

※フォークの定理については池田が詳細を述べているのでこれを参考にしてほしい。

marikoi

ここの主筆・共同管理人。ぶっちゃけ狂人。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA