初めに
本記事では、二項分布の定義と期待値、分散についてまとめる。二項分布の定義の部分では、補足として、ベルヌーイ試行についても触れる。
二項分布
定義(二項分布)
確率 \(p\) で \(A\) か \(B\) かの2通りの結果をとる試行を独立に \(n\) 回繰り返したとき、\(A\) が起こる回数を \(X\) とする。このとき、\(q = q \ – \ p\) とすると、
\[
P(X = r) = {}_n C_r p^r q^{n \ – \ r} \ (r = 0, 1, \cdots, n)
\]
となるため、\(X\)の確率分布は以下のようになる。
\(X\) | \(0\) | \(1\) | \(\cdots\) | \(n\) | 計 |
\(P\) | \({}_n C_0 p^0 q^n\) | \({}_n C_1 p^1 q^{n \ – \ 1}\) | \(\cdots\) | \({}_n C_n p^n q^0\) | \(1\) |
このような各確率は二項定理に従っている。このような分布のことを二項分布といい、\(B(n, p)\) と表す。また、確率変数 \(X\) が二項分布 \(B(n, p)\) に従うことを \(X \sim B(n, p)\) と表す。
補足
確率 \(p\) で \(A\) か \(B\) かの2通りの結果をとる試行をベルヌーイ試行という。結果 \(A\)、\(B\) は一方を成功、片方を失敗とする。
成功確率 \(p\) のベルヌーイ試行に対し、確率変数 \(X_k\) が \(X_k = 1\)のとき成功、\(0\) のとき失敗とすると、
\[
P(X_k = 1) = p, \ P(X_k = 0) = 1 \ – \ p
\]
である。
\(X_k\) の従う分布を成功確率 \(p\) のベルヌーイ分布といい、\(Bin(1, p)\) と表す。
成功確率 \(p\) のベルヌーイ試行 \(Bin(1, p)\)を独立に \(n\) 回行ったときの成功回数を確率変数 \(X\) としたとき、\(X\) が従う分布が二項分布 \(B(n, p)\) である。\(k\) 回目のベルヌーイ試行に従う確率変数を \(X_k\) とすると
\[
X = X_1 + X_2 + \cdots + X_n
\]
と表せる。
二項分布の期待値、分散
確率変数 \(X\) が二項分布 \(B(n, p)\) に従うとする。また、\(q = 1 \ – \ p\) とする。このとき、\(X\) の期待値 \(E(X)\)、分散\(V(X)\) は次が成り立つ。
\[\begin{align}
E(X) &= np \notag \\
V(X) &= np(1 – p) = npq \notag
\end{align}\]
証明
\(k \in \{0, 1, \cdots, n\}\) とする。また、\(k\) 回目の試行において、事象 \(A\) が起こると \(1\)、起こらなければ \(0\) とする確率変数を \(X_k\) とする。このとき、
\[
X = X_1 + X_2 + \cdots + X_n
\]
となる。\(X_1, X_2, \cdots, X_n\) は互いに独立であるため、
\[\begin{align}
E(X) &= E(X_1 + X_2 + \cdots + X_n) \notag \\
&= E(X_1) + E(X_2) + \cdots + E(X_n) \notag \\
V(X) &= V(X_1 + X_2 + \cdots + X_n) \notag \\
&= V(X_1) + V(X_2) + \cdots + V(X_n) \notag
\end{align}\]
が成り立つ。
\(E(X_k), V(X_k) \ (k = 0, 1, \cdots, n)\) は次のようになる。
\[\begin{align}
E(X_k) &= 1 \cdot p + 0 \cdot (1 \ – \ p) = p \notag \\
E({X_k}^2) &= 1^2 \cdot p + 0^2 \cdot (1 \ – \ p) = p \notag \\
V(X_k) &= E({X_k}^2) \ – \ \{E(X_k)\}^2 = p \ – \ p^2 = p(1 \ – \ p) = pq \notag
\end{align}\]
したがって、
\[\begin{align}
E(X) &= np \notag \\
V(X) &= npq \notag
\end{align}\]
となる。
練習問題
練習問題1
問題
1枚のコインを10回投げるとき、表がでる回数を \(X\) とする。次の問いに答えよ。
(1) \(X = 8\)となる確率を求めよ。
(2) 期待値 \(E(X)\) を求めよ。
(3) 分散 \(V(X)\) を求めよ。
解答
確率変数 \(X\) は二項分布 \(B(10, \frac{1}{2})\) に従う。
(1)
\[\begin{align}
P(X = 8) = {}_{10} C_8 \left(\frac{1}{2} \right)^8 \left(\frac{1}{2} \right)^2 = \frac{45}{2^{10}} = \frac{45}{1024}
\end{align}\]
(2) \(E(X) = 10 \times \frac{1}{2} = 5\)
(3) \(V(X) = 10 \times \frac{1}{2} \times \frac{1}{2} = \frac{5}{2} = 2.5\)
解説
\(B(10, \frac{1}{2})\) より試行回数 \(n = 10\) であり、\(p = \frac{1}{2}, q = 1 \ – \ p = \frac{1}{2}\) である。