決定係数(R2)と赤池情報量基準(AIC)の違い

統計モデルを組み、観察されている現象がうまく表現できているのかを評価する。この一連の流れの中で、「説明力」という言葉をよく耳にします。R2とAIC、いずれもこの「説明力」というコンテクストで使われことが多いと思うのですが、両者には決定的な違いがあります。

決定係数(R2

R2のほうが「説明力」という言葉を当てるのにふさわしい指標だと思います。R2は、もともと応答変数に存在していたばらつきが、「説明変数を加えることによってどれだけ減ったか」を表しているものです()。R2=1.0となるとすべてのばらつきが説明されたことになります(ほぼありえないですが)。つまり、R2は現在手持ちのデータに対する説明力を表している指標となります。

注意しなければならないのは、無駄な説明変数を加えた場合でも、R2は改善されてしまうことです。例えば、応答変数yと一切関係のないランダム変数xをモデルに加えた場合でも、R2は増加します。

赤池情報量基準(AIC)

一方AICは、「AICの低いモデルのほうが、新しいデータセットに対してより適切な予測を導いてくれる」という数学的な裏付けがなされています。表面的な理解としては、パラメーター数Kでペナルティが付くような式になっている(有益な情報のない変数は「無駄」と評価される)ということでいいのかもしれません。しかし、上記のように、予測の頑健性を評価している(ただし同じ母集団の別サンプルに対する予測)という点は抑えておいたほうがいいような気がします。この意味において、パラメーター数でペナルティ付けをする自由度調整済み決定係数(adjusted R2)とも根本的な意味が異なっています。

両者の使い分け

前者は「現状のデータに対する当てはまり」、後者は「新しいデータに対する予測の頑健性(ただし同じ母集団であることが条件)」を評価しているので、この意味合いを考えたうえで両者を使い分ける必要があると思います。例えば、まったく予測に興味がなく、現状のモデルがどれだけ観察値を説明できているかを知りたい場合はR2、作ったモデルの推定値から地図化などを行いたい場合はAICを用いたほうがいいと思います。ただし、いずれも与えられた説明変数の中だけでの「ベスト」を選ぶので、その限界を十分理解することが大事なのだと思います。

SPONSOR LINK

Spread the love

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です