検定の基本的な考え方

違いがある?

検定

ある実験を行い、植物の成長に対する施肥の影響を調べたとします。実験者の仮説は「栄養を与えれば成長が早くなる」というもので、処理区では肥料を与え、未処理区では水のみを与えたとします。両区の最終的な植物体の重さがデータとして得られる時に、どうすれば「処理区間で平均重量に違いがある」という主張に裏付けを与えることができるのでしょうか。その最もシンプルな方法に「検定」があります:逆説的ですが、いったん「両者に違いはない」という仮定(帰無仮説)を置き、その仮定のもとで観察値が生じる確率(p-value)を計算する手法です。上の例で考えると、処理のある・なしに関わらず、両グループの平均重量には違いがないとし、その仮定のもとで「観察された数の違い」が生じる確率を計算します。この確率が非常に小さいならば(慣習として< 0.05とされる)、「処理区間には違いがある」と考えたほうが妥当という結論に落ち着きます。

検定が評価しているもの

検定が評価対象とするのは、グループ間の違いが「コンスタントかどうか」です。上の例で、各処理区5個体の植物体の重さを測ったとき、施肥したほうが平均30gも重かったとします。しかし、個体間のばらつきが大きく、肥料を与えた場合も2/5個体は未処理区よりも成長が悪かったしましょう。この場合、一貫して「施肥の効果」が得られたとは言えず、30gの違いは「サンプリングの際に、たまたま変に成長のよかった個体が計測されただけ(部分を取り出したことによる誤差)」として解釈されます。一方、処理区で平均1gしか重くなっていなかったとしても、すべての個体が未処理区よりも重くなっていた場合には、統計的には有意差があるとされます。なお、サンプリングに由来する誤差ですが、通常は繰り返しの数が増えるとともに小さくなる特徴を持っています(分母に繰り返し数nが入った数式のため)。そのため、有意差(p < 0.05)が検出できるかどうかは繰り返しの数に強く依存します(サンプルサイズが大きいほど有意差を検出しやすい)。

確率分布

サンプリングに伴って生じる「誤差のタイプ」、つまり確率分布はユーザーが考えて指定する必要があります。基本的には「違いの有無」を知りたい変数の数の特徴(上の例であれば植物体の重さ)から判断することになります(参考)。この確率分布の選び方は非常に重要で、仮に不適切な確率分布の元で検定を行った場合、本当は違いがあっても「違いがない」という結論が得られる場合もあります(逆もしかり)。

有意差がなかったときの解釈

最後に、有意差が得られた場合はどういうことを意味するのでしょうか。有意差がなかった場合、これはグループ間の平均が「同じである」ということは意味しません。検定の考え方から、「違いがある」という仮説が棄却されただけであって、「同じである」という仮説を積極的に支持しているわけではありません。

SPONSOR LINK

Spread the love

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です