統計学:ベイズ統計の初歩(ベイズの定理)を使ってあなたの思い人のチョコが本命の確率を推定しよう!

       P(A|B)P(B)
P(B|A)=-----------------・・・ベイズの定理
              P(A)

さてこれを踏まえたうえで、あなたの彼女のチョコレートが本命である確率をベイズの定理を用いて判別してみましょう。ここで…P(B|A)・・・Aが起きた後Bが起きる確率、P(A|B)・・・Bが起きた後でAが起きる確率、P(A)・・・Aが起きる確率、P(B)・・・Bが起きる確率、とそれぞれ定義。ベイズ更新の概念を持ち出せば、この難問も主観統計的には解けるのです。

ベイズの定理より一般化して…

Dが得られたときにHが成立している確率

    HのもとでDが生じる確率*Hが成立する確率
=---------------------------------------
              Dが得られた確率

ここで、
D:チョコをもらう(D:データ)
H:本命である(H:仮説)

より一般化して…

チョコをもらうときに本命である確率

  本命のときにチョコをもらう確率*本命である確率・・・「事前確率」本命か?義理か?
=-----------------------------------------
        チョコをもらえた確率・・・加法定理と乗法定理を使って求める間接的な値。

◆尤度表

チョコGet確率orLost確率 本命 義理
チョコGet確率 0.4 0.2
チョコLost確率 0.6 0.8

◆「事前確率」本命か義理か?

本命 義理
0.5 0.5

のとき、チョコをもらえた確率を加法定理と乗法定理を使って、分母は0.4*0.5+0.2*0.5=0.3となる。
これは…

チョコをもらえた確率=本命のときにチョコGet確率*本命確率+義理のときにチョコGet確率*義理確率

という等式で求められる。ゆえに…

チョコをもらうときに本命である確率=(0.4*0.5)/0.3=0.666・・・=66パーセント・・・答え

これが回答で、至極当然だが数理的にもチョコをもらえばそれは本命というほうの確率が高いのがわかりますね!よりデータを収集して、ベイズ更新をすればもっとデータは集まるようになっていくはずです。アルゴリズムとしてはいくつか考えられるわけですが、ここでは面積図を求めずにガンガン数式で攻めてみました。ほかの方法でもやっていることは同じ。

①事前確率を主観的に指定する。
②調査データとして尤度を作っていく。
③ベイズの定理に基づいて、データを更新していく。
④事前確率によって事後確率がベイズ推定で求まる。
といったところか。

注意しておきたいのは、このベイズ推定は主観確率だということで、客観確率ではないということだ。 だから批判もあるが、MSやGoogle、Amazonといったような大手のIT企業がこのあたりを押さえていて、ベイズ・ラプラス統計学の歴史がよみがえっているのも事実…。ただし過信は禁物!

※感想
もっとわかりやすく作りたかったんですが、いかんせん加法定理と乗法定理を使ってしまったので(面積図を使わずに)、わかりにくくなりました。もっとわかりやすく数式を限りなく削って面積図でアルゴリズムを知りたいのであればぜひこれを参考書に。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA