二項分布の正規分布による近似:ド・モアブル-ラプラスの定理

初めに

本時期は二項分布 \(Bin(n, p)\) が \(n\) が十分大きいとき、正規分布 \(N(np, np(1 \ – \ p)\) に近似できることを主張したド・モアブル-ラプラスの定理を証明します。今回は、中心極限定理を用いた証明をしています。

ド・モアブル-ラプラスの定理

二項分布 \(Bin(n, p)\) に従う確率変数 \(X\) とする。このとき、\(n \rightarrow \infty\) において
\[
X \sim N(np, npq)
\] が成り立つ。ただし、\(q = 1 \ – \ p\) であり、\(N(np, npq)\) は平均 \(np\)、分散 \(npq\) とする正規分布である。

証明

中心極限定理を用いて証明する。

中心極限定理

確率変数 \(X_1, X_2, \cdots, X_n\) が互いに独立に同じ分布に従い、
\[
E(X_i) = m, \ V(X_i) = \sigma^2 > 0
\]
をみたすとする。また、標本平均を
\[
\overline{X} = \frac{1}{n} \sum_{i = 1}^n X_i
\]
とする。このとき、\(n \rightarrow \infty\) とすると
\[
Z_n = \frac{\overline{X} \ – \ m}{\sqrt{\frac{\sigma^2}{n}}}
\]
は標準正規分布 \(N(0, 1)\) に従う。すなわち、\(Z_n \sim N(0, 1)\) となる。

証明

確率変数 \(X\) は二項分布 \(Bin(n, p)\) に従うので、\(i\) 回目のベルヌーイ試行にあたる確率変数を \(X_i\) とすると、\(X_i\) は成功確率 \(p\) のベルヌーイ分布に従うので \(X_i \sim Bin(1, p), (i = 1, 2, \cdots, n)\) となる。このとき、
\[
E(X_i) = p, \ V(X_i) = p(1 \ – \ p), \ (i = 1, 2, \cdots, n)
\]
が成り立つ。

いま、確率変数 \(X\) は \(X_1, X_2, \cdots, X_n\) を用いて、
\[
X = X_1 + X_2 + \cdots + X_n
\]
と表せるので、中心極限定理より \(n \rightarrow \infty\) のとき
\[\begin{align}
\frac{\frac{1}{n} \sum_{i = 1}^n X_i \ – \ p}{\sqrt{\frac{p(1 \ – \ p)}{n}}} \sim N(0, 1)
\end{align}\]
が成り立つ。これから
\[
\frac{\frac{1}{n} \sum_{i = 1}^n X_i \ – \ p}{\sqrt{\frac{p(1 \ – \ p)}{n}}
} = \frac{X \ – \ np}{\sqrt{np(1 \ – \ p)}} \sim N(0, 1)
\]
が導ける。実数 \(a, b\) において、
\[
X \sim N(\mu, \sigma^2) \Rightarrow aX + b \sim N(a \mu + b, a^2 \sigma^2)
\]
であることを使うと、
\[\begin{align}
\frac{X \ – \ np}{\sqrt{np(1 \ – \ p)}} \sim N(0, 1) & \Rightarrow X \ – \ np \sim N(0, np(1 \ – \ p)) \notag \\
& \Rightarrow X \sim N(np, np(1 \ – \ p)) \notag
\end{align}\]
が成り立つ。条件より \(q = 1 \ – \ p\) であり、題意は示せた。

補足

中心極限定理ではなく、スターリングの公式を用いた証明もある。

\[
n! ≒\sqrt{2 \pi n} \left( \frac{n}{e} \right)^n
\]
ここで \(f(n) ≒ g(n)\) は \(f(n)\) と \(g(n)\) が漸近的に等しいこと、すなわち \(\displaystyle{\lim_{n \rightarrow \infty} \frac{f(x)}{g(x)} = 1}\) を表す。

スターリングの公式(Stirling’s formula)
初めに 本記事では、スターリングの公式を示す。ド・モアブル-ラプラスの定理(二項分布がサンプル数が十分大きいとき正規分布に近似できる)の証明に使われる公式です。 スターリングの公式(Stirling’sformula) \ここで \(f(n...

中心極限定理の内容や証明をきちんとすると、法則収束や特性関数の知識が必要となる。そのため、本記事では触れていない。後日、機会があれば記事にするかもしれない。

タイトルとURLをコピーしました