モデルの予測力を評価する

論文:Yamamura K (2016) Estimation of the predictive ability of ecological models. .
掲載誌:Communications in Statistics - Simulation and Computation 45: 2122-2144
DOI: 10.1080/03610918.2014.889161.

著者版原稿はこちらから取得可能 RD_criterion.pdf (730KB)

印刷版は Taylor & Francis のサイトから取得可能 http://www.tandfonline.com/doi/full/10.1080/03610918.2014.889161

モデル評価の重要性

モデル選択の際にはAIC(Akaike Information Criterion)やBIC(Bayesian Information Criterion)がよく用いられる。これらの指標は複数のモデル間の相対的な良さを示すため,これらの指標を用いて最良モデルを選択することができる。しかし,これらの指標はその選択された最良モデルが「どれだけ良いのか」については何も示してくれない。選ばれたモデルは所与のデータのもとでは最良モデルではあるが,それはほとんど役に立たないモデルだという場合も多い。まず現在のデータの量や質が十分であるかどうかを判断し,そして,データの量や質が不十分であると判断された場合には,さらにデータの量や質を改善してモデルを再構築し,さらにモデル評価を繰り返す必要がある。このようなサイクルを繰り返すことによってのみ信頼できるモデルが構築できると考えられる。しかし,AIC や BIC はこの推論サイクルを駆動する上では全く役に立たない。一般に,「モデル選択」を行うだけではなく,きちんと「モデル評価」を行うことが非常に重要である。

RD 指数の提案

モデルが良いかどうかを判定する基準はいろいろと考えられるが、統計モデルの性質から考えれば「そのモデルによる予測が実際に当たるかどうか」で判断するのがもっとも妥当だと考えられる。Yamamura(2014)では、そのようなモデルの評価基準としてRD 基準を提案した。手持ちのデータを用いてモデルを構築して、次にそれを新しいデータに適用したときに、構築したモデルの元でその新しいデータが発生する確率の対数値として予測力を定義し、その予測力の改善割合Rpred を考える。将来のデータをすべて知っている「神」が予測した場合にRpred は100%となり、説明変数をまったく持たない「凡人」が予測した場合にRpred が0%となるように改善割合Rpred は定義される。このRpred の推定値としてRD が導出されている。RD は一般には次式で与えられる。

RD = 1 - (lmax - l + k)/(lmax - lnull + θ)

ここにkRD の計算対象とする候補モデルに含まれるパラメーター数である。l は候補モデルでの対数尤度であり、lnull は切片だけを含むモデル(null model)における対数尤度である。lmax は固定効果パラメーター数とデータ数が等しい最大モデル(maximal model)における対数尤度である。ただし、すべての要因効果を入れたモデルのもとで推定した分散を用いてl, lnull, lmaxは計算される。その点で、計算手順はAICと違ってかなり複雑になる。θは切片の数であり、1変量の場合はθ=1である。RD を計算して自動的に最適なモデルを見つけるための1変量用のR関数とSASマクロが下記の場所に置いてある

http://cse.naro.affrc.go.jp/yamamura/RD_criterion_program.html

RD に関する若干の解説文もこのサイトに置いてある。このR関数は一般化線型モデル専用である。これに対して,SASマクロは一般化線形混合モデル用であり,線形モデル,一般化線型モデル,一般化線形混合モデルに広く対応している。



トピック一覧へ戻る