尤度

尤度

統計の教科書では、尤度(もしくは対数尤度)という言葉を頻繁に目にすると思います。しかし、その意味するところはあまり考えないことが多いのではないでしょうか。というのも、Rの普及に伴い、特にその言葉の意味を理解しなくとも、ある程度の統計解析は簡単にできてしまうからです。ですが、解析の意味をきちんと理解したり、より高度な統計解析を行おうとするときには、尤度の意味をしっかりと理解することが必要になってきます。では、文字通りに受け取ると「尤(もっと)もらしさ」を表す尤度ですが、なにをもって尤もらしさを測っているのでしょうか。尤度には、「パラメーター」が深く関わっているので、まずはパラメーターの言葉の意味を整理し、そのあとに尤度の説明をすることになります。

パラメーター

パラメーター(母数)とは、推定対象となる未知の数(つまり知りたいもの)を表します。例えば、日本人の平均収入を知りたいとして、アンケート調査を行ったとします。しかし、すべての日本人に対してアンケート調査を行うことは不可能なので、1000人にアンケートをお願いして回答を得ました。このとき、「すべての日本人の収入の平均μ」が推定対象となる未知の数(パラメーター)であり、その一部の情報をもつ調査データ(1000人分の回答)から推定することになります。同様に、標準偏差や偏回帰係数も、「知りたい未知の値」なので、パラメーターの枠に収まります。

尤度

データ(サンプル)は、あるパラメーターによって特徴づけられた「数の集まり(母集団)」から(ランダムに)選び取られてきた数値です。上の例では、1000人分のデータは日本人という集まりの「部分」なので、「すべての」日本人の平均収入μ(円)、ばらつき(標準偏差)σ(円)という特徴を持った母集団から観察されたはずです。しかし、μとσはわからないので、とりあえず適当な平均MとばらつきVの値を代入し、「1000人分の収入X1~X1000が同時にドンピシャで観察される確率」を出すことで、MとVの平均・ばらつきとしての「尤もらしさ」をみてみることになります。これが尤度です。確率分布(部分抽出に伴う誤差)をf(x)としたとき、尤度L(Xi|M,V)は以下の式で与えられます。

L(Xi|M,V) = f(X1|M,V)*f(X2|M,V)…*f(X1000|M,V)
※縦棒は条件付きの意味を表す。例えばf(X1|M,V)は、平均をM、ばらつきをVとしたときにX1が観察される確率を表す。

最尤法

では、いったい平均μとばらつき(標準偏差)σをどれくらいの値にしたら尤度は最大となるのでしょうか。この問題を解くには、尤度関数L(X)を微分し、その導関数が0と等しくなるMおよびVを明らかにすればよさそうです(尤度が最大となるようなパラメーター探索を最尤法と呼ぶ)。ただし、尤度は積の形で表されているので、そのままでは計算量が膨大になってしまいます。ですが、対数をとって和の形に変換してあげれば(対数尤度)、その計算量は大きく減らせます。通常、尤度ではなく「対数尤度(Log-liklihood)」がRのアウトプットとして出されるのにはこういった理由があります。

SPONSOR LINK

Spread the love

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です