初めに
本記事では、データの分析で最後に学ぶ仮説検定について学びます。P値や有意水準など教科書には載っていない用語を用いています。
仮説検定
用語解説
仮説検定
仮説検定:データからある仮説が正しいかどうかを分析する手法
帰無仮説
帰無仮説:検定の最初に立てる仮説。対立仮説の否定を帰無仮説にする。
対立仮説
対立仮説:本来証明したい仮説
P値
P値:帰無仮説が正しいとした仮定とき、観測した事象よりも稀なことが起こる確率
有意水準
有意水準:帰無仮説が間違っていると判断する(帰無仮説を棄却する)基準となる確率
P値が有意水準より小さい場合、通常であれば起こりづらいことが起きており、帰無仮説が間違っていると判断する。
仮説検定の流れ
仮説検定は背理法を用い、次の流れで行う。
- 帰無仮説が成り立つことを仮定する
- P値(帰無仮説が正しいとした仮定とき、観測した事象よりも稀なことが起こる確率)を求める
- P値と有意水準を比較し、判断する
\[\begin{align}
\text{P値} &< \text{有意水準} \Rightarrow \text{帰無仮説を棄却し、対立仮説が正しいと判断できる} \\
\text{P値} &> \text{有意水準} \Rightarrow \text{帰無仮説が棄却できず、対立仮説が正しいとはいえない}
\end{align}
\]
例題
問題
あるコインを10回投げたとき、表が8回、裏が2回出た。このとき、このコインは表が出やすいといえるか。有意水準を0.05として、検定せよ。
解答
帰無仮説を「このコインは表が出る確率と裏が出る確率は等しい」とする。帰無仮説のもとでは、
\[
\text{表が出る確率} = \text{裏が出る確率} = \frac{1}{2}
\]
が成り立つ. このコインを10回投げたとき、表が8回、裏が2回出る確率は
\[
{}_{10} C_{8} \left(\frac{1}{2} \right)^8 \left(\frac{1}{2} \right)^2 = \frac{45}{2^{10}} = \frac{45}{1024} = 0.043…
\]
よって、P値\(= 0.043… < 0.05\) となり、帰無仮説が棄却される。したがって、対立仮説が正しいと判断でき、このコインは表が出やすいといえる。
練習問題
問題
ゲームセンターにじゃんけんをするゲーム筐体が置いてあった。この筐体で8回ゲームをした結果、グーを5回、チョキを2回、パーを1回出してきた。このとき、このゲーム筐体はグーを出しやすいといえるか。有意水準を0.05として、検定せよ。
解答
帰無仮説を「グー、チョキー、パーを出す確率はすべて等しい」とする。帰無仮説のもとでは、
\[
\text{グーを出す確率} = \text{チョキを出す確率} = \text{パーを出す確率} = \frac{1}{3}
\]
であり、この筐体で8回ゲームをした結果、グーを5回、チョキを2回、パーを1回出してくる確率は
\[
{}_{8} C_{5} \left(\frac{1}{3} \right)^5 \left(\frac{2}{3} \right)^3 = \frac{56 \times 8}{3^8} = \frac{448}{6561} = 0.068…
\]
である。よって、P値\(= 0.068… > 0.05\) となり、帰無仮説は棄却されない。したがって、対立仮説は正しいと判断できず、このゲーム筐体はグーを出しやすいとはいえない。
最後に
これで、数学Ⅰのデータの分析は終了です。お疲れさまでした。
次に学ぶ範囲は、統計学の分野に限れば、
- 数学A:場合の数と確率
- 数学B:統計的な推測
のどちらかになるかと思います。