人工知能:機械学習とデータマイニングの違いって何?

このあたりは複雑すぎて名著とされる本でさえ情報が集まっておりません。たとえば、強化学習は実は教師あり学習としても見られますし、Wikipediaの記事のようにこれが別となっている見方もあります。さらにさらに、教師あり学習と教師なし学習でもってして、機械学習とデータマイニングの垣根も超えるくるし、どういう分類になっているのかということすらわかりにくいのですが、自分で勉強したことを書いていきます。

・機械学習は既知の問題を扱う、それに対して未知の問題を扱うのがデータマイニングである。
・機械学習は教師あり学習と教師なし学習および強化学習から基本的には構成される。
・ただし、機械学習は教師あり学習のひとつであるという見方もできる。*1
・精密にいえば、これらから発展した半教師あり学習という考え方もあるので厳密にはいえない。*2

*1解説
強化学習というのは簡単に言えばフィードバックの理論であって、評価となる報酬を与えることで、予測に修正を加える学習のことをいう(予測があるので教師あり学習のひとつとしても扱える)。教師あり学習とは将来の成功例が見受けられる(教師となるラベルがあるともいう)機械学習のことを言う。たとえば将棋では勝ち負けがあるので、これを報酬としたり教師としたりするのである。複雑だ…。

*2解説
教師なし学習ってのは要するに教師がない=報酬とか事前の予測がない将来に対する未知を切り開く機械学習のことを言う。もっともあいまいな垣根があって、ありとなし学習とを組み合わせた、半教師学習ってのもあるので、頭の片隅においておいてほしい。

統計でおなじみの回帰分析は教師あり学習の中でも連続変数を取り扱うものであって、予測変数と原因変数を組み合わせてつくる線形モデルのことを言う。要するに連続値を取り扱う教師あり学習のことである。いわゆる「次元の呪い(The curse of dimensionality)」を解決するためには教師なし学習の圧縮技術が盛り込まれることも多い。

marikoi

ここの主筆・共同管理人。ぶっちゃけ狂人。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

CAPTCHA