パターン認識と機械学習入門 第3回 参加メモ
資料
モデル選択基準
赤池情報量基準(AIC)
AICが最小となるようにモデルを選択する
AIC = -2 ln L + 2M
Lは最大尤度、Mはモデルのパラメータ数
ベイズ情報量基準(BIC)
AICに比べて複雑さに大きなペナルティを課す
BIC = -2 ln L + M ln n
Lは最大尤度、Mはモデルのパラメータ数、nは学習データの数
最小記述長(MDL)
MDL = BIC / 2 なので BIC と等価ベイズ線形回帰
最小二乗法はパラメータaの分布が一切考慮されていない.これが過学習の生じる原因である.そこで、パラメータaの事前分布 π(a) を導入し、MAP推定を行う.
マルコフ連鎖モンテカルロ法(MCMC法)
モンテカルロ法
- 乱数を用いて行う数値計算法の総称
- 高次の重積分を効率的に計算するために必要
- 大数の強法則を基本原理とする
- 一般にモンテカルロ法ではサンプル数Nに対して 1/√N のオーダで誤差が減少していく
- 重積分の計算を期待値の計算に帰着できる
- 重点的サンプリング
- 棄却サンプリング
- マルコフ過程を乱数発生機と見なせる
マルコフ連鎖モンテカルロ法とは
- サンプリングを行いたい分布 π(x) が不変分布になるようなマルコフ連鎖を生成する事によって π(x) からのランダムサンプリングを実現する手法
- メトロポリス・ヘイスティング法(MH法)