数学B:確率分布と統計的な推測②同時分布 

初めに

 本記事では、同時分布の定義、確率変数の独立性、2変数以上の期待値、分散についてまとめる。

同時分布

定義(同時分布)

 確率変数 \(X, Y\) と実数 \(a, b\) に対し、\(X = a, Y = b\) が同時に成り立つ確率を \(P(X = a, Y = b)\) と表す。

 確率変数 \(X, Y\) の取りうる値とその確率との対応関係を \(X, Y\) の同時確率分布という。

 確率変数 \(X\) の取りうる値を \(x_1, x_2, \cdots, x_m\), 確率変数 \(Y\) の取りうる値を \(y_1, y_2, \cdots, y_n\) とする。このとき、
\[
P(X = x_i, Y = y_j) = p_{ij} \ (i = 1, 2, \cdots, m, j = 1, 2, \cdots, n)
\]
を同時確率関数という。同時確率分布は次のように表される。

\(X\Y\)\(y_1\)\(y_2\)\(\cdots\)\(y_n\)
\(x_1\)\(p_{11}\)\(p_{12}\)\(\cdots\)\(p_{1n}\)\(p_{1}\)
\(x_2\)\(p_{21}\)\(p_{22}\)\(\cdots\)\(p_{2n}\)\(p_{2}\)
\(\vdots\)\(\vdots\)\(\vdots\)\(\ddots\)\(\vdots\)\(\vdots\)
\(x_m\)\(p_{m1}\)\(p_{m2}\)\(\cdots\)\(p_{mn}\)\(p_{m}\)
\(q_1\)\(q_2\)\(\cdots\)\(q_n\)\(1\)

 ところで、
\[\begin{align}
P(X = x_i) &= \sum_{j = 1}^n p_{ij} = p_i \ (i = 1, 2, \cdots, m) \notag \\
P(X = y_j) &= \sum_{i = 1}^m p_{ij} = q_j \ (j = 1, 2, \cdots, n)\notag \\
\end{align}\]
をそれそれ \(X, Y\) の周辺確率関数といい, その分布を周辺分布という。周辺分布は次のようになる。

\(X\)\(x_1\)\(x_2\)\(\cdots\)\(x_m\)
\(P\)\(p_{1}\)\(p_{2}\)\(\cdots\)\(p_{m}\)\(1\)
\(Y\)\(y_1\)\(y_2\)\(\cdots\)\(y_n\)
\(P\)\(q_{1}\)\(q_{2}\)\(\cdots\)\(q_{n}\)\(1\)

定義(確率変数の独立性)

 確率変数 \(X, Y\) が取りうる値をそれぞれ \(x_i \ (i = 1, 2, \cdots, m)\), \(y_j \ (j = 1, 2, \cdots, n)\) とする。

 すべての \(i, j\) において、
\[
P(X = x_i, Y = y_j) = P(X = x_i) P(Y = y_j)
\]
が成り立つとき、\(X, Y\) は独立であるという。

補足

 2つの確率変数において、上記のように独立を定義したが、3つ以上の場合についても同様に定義される。

確率変数の期待値

 実数 \(a, b\), 確率変数 \(X, Y\) において、次が成り立つ。
\[\begin{align}
E(a X + b Y) = a E(X) + b E(Y) \notag
\end{align}\]

 また、\(X, Y\) が独立のとき、次が成り立つ。
\[
E(XY) = E(X)E(Y)
\]

証明

 確率変数 \(X, Y\) が取りうる値をそれぞれ \(x_i \ (i = 1, 2, \cdots, m)\), \(y_j \ (j = 1, 2, \cdots, n)\) とする。また、同時確率関数を \(P(X = x_i, Y = y_j) = p_{ij}\) とする。
\[\begin{align}
E(a X + b Y) &= \sum_{i = 1}^m \sum_{j = 1}^n (a x_i + b y_j) p_{ij} \notag \\
&= \sum_{i = 1}^m \sum_{j = 1}^n a x_i p_{ij} + \sum_{i = 1}^m \sum_{j = 1}^n b y_j p_{ij} \notag \\
&= a \sum_{i = 1}^m x_i \sum_{j = 1}^n p_{ij} + b \sum_{j = 1}^n y_j \sum_{i = 1}^m p_{ij} \notag \\
&= a \sum_{i = 1}^m x_i p_i + b \sum_{j = 1}^n y_j q_j \notag \\
&= a E(X) + b E(Y) \notag
\end{align}\]

 また、\(X, Y\) が独立のとき、\(p_{ij} = p_i q_j\) であるので
\[\begin{align}
E(XY) &= \sum_{i = 1}^m \sum_{j = 1}^n x_i y_j p_{ij} \notag \\
&= \sum_{i = 1}^m \sum_{j = 1}^n x_i y_j p_i q_j \notag \\
&= \sum_{i = 1}^m x_i p_i \sum_{j = 1}^n y_j q_j \notag \\
&= \sum_{i = 1}^m x_i p_i E(Y) \notag \\
&= E(Y) \sum_{i = 1}^m x_i p_i \notag \\
&= E(Y) E(X) \notag \\
&= E(X) E(Y) \notag
\end{align}\]

確率変数の和の分散、共分散

 確率変数 \(X, Y\) において、次が成り立つ。
\[\begin{align}
Cov(X, Y) &= E(XY) – E(X)E(Y) \notag \\
V(X \pm Y) &= V(X) \pm Cov(X, Y) + V(Y) \notag
\end{align}\]
 \(X\) と \(Y\) が独立のとき、次が成り立つ。
\[\begin{align}
Cov(X, Y) &= 0 \notag \\
V(X \pm Y) &= V(X) + V(Y) \notag
\end{align}\]
ところで、\(Cov(X, Y)\) は \(X\) と \(Y\) の共分散である。

証明

 \(E(X) = \mu_x, E(Y) = \mu_y\) とする。
\[\begin{align}
Cov(X, Y) &= E((X – \mu_x)(Y – \mu_y)) \notag \\
&= E(XY – \mu_x Y – \mu_y X + \mu_x \mu_y) \notag \\
&= E(XY) – \mu_x E(Y) – \mu_y E(X) + E(\mu_x \mu_y) \notag \\
&= E(XY) – \mu_x E(Y) – \mu_y E(X) + \mu_x \mu_y \notag \\
&= E(XY) – E(X)E(Y) – E(Y)E(X) + E(X)E(Y) \notag \\
&= E(XY) – E(X)E(Y) \notag
\end{align}\]

また、
\[\begin{align}
V(X \pm Y) &= E((X \pm Y)^2) \ – \ \{E(X \pm Y)\}^2 \notag \\
&= E(X^2 \pm 2 XY + Y^2) \ – \ (E(X) \pm E(Y))^2 \notag \\
&= E(X^2) \pm 2 E(XY) + E(Y^2) \notag \\
& \ \ \ \ \ \ \ \ – \ (\{E(X)\}^2 \pm 2 E(X)E(Y) + \{E(Y)\}^2) \notag \\
&= (E(X^2) \ – \ \{E(X)\}^2) \pm 2 (E(XY) \ – \ E(X)E(Y)) \notag \\
& \ \ \ \ \ \ \ \ + (E(Y^2) \ – \ \{E(Y)\}^2) \notag \\
&= V(X) \pm Cov(X, Y) + V(Y) \notag
\end{align}\]

 \(X\) と \(Y\) が独立のとき、\(E(XY) = E(X)E(Y)\) より
\[
Cov(X, Y) = E(XY) \ – \ E(X)E(Y) = E(X)E(Y) \ – \ E(X)E(Y) = 0
\]
である。これにより \(V(X \pm Y) = V(X) + V(Y)\) は明らか。

練習問題

練習問題1

問題

 1枚のコインを投げる試行と1個のサイコロを振る試行同時に行った。このとき、コインが表の場合 \(X = 0\), 裏の場合 \(X = 1\) とする。また、サイコロの出た目を \(Y\) とすると、\(X\) と \(Y\) の同時分布は次のようになる。次の問いに答えよ。
(1) 次の同時分布表を完成させよ。

\(X\Y\)\(1\)\(2\)\(3\)\(4\)\(5\)\(6\)
\(0\)
\(1\)

(2) 周辺確率 \(P(X = 1)\)の値を答えよ。

解答

(1) すべての確率が \(\frac{1}{2} \times \frac{1}{6} = \frac{1}{12}\) であるため、次のようになる。

\(X\Y\)\(1\)\(2\)\(3\)\(4\)\(5\)\(6\)
\(0\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{2}\)
\(1\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{12}\)\(\frac{1}{2}\)
\(\frac{1}{6}\)\(\frac{1}{6}\)\(\frac{1}{6}\)\(\frac{1}{6}\)\(\frac{1}{6}\)\(\frac{1}{6}\)\(1\)

(2) 同時分布表より \(P(X = 1) =\frac{1}{2}\) である。

練習問題2

問題

 白玉3個、赤玉2個が入った袋の中から同時に2個取り出して戻すことを2回行い、1回目と2回目に取り出す白玉の個数をそれぞれ \(X, Y\) とする。
(1) \(E(X)\) を求めよ。
(2) \(E(2X + Y)\) を求めよ。
(3) \(E(XY)\) を求めよ。
(4) \(V(X + Y)\) を求めよ。

解答

(1)
\[\begin{align}
P(X = 0) &= \frac{{}_2 C_2}{{}_5 C_2} = \frac{1}{10} \notag \\
P(X = 1) &= \frac{{}_3 C_1 \times {}_2 C_1}{{}_5 C_2} = \frac{6}{10} = \frac{3}{5} \notag \\
P(X = 2) &= \frac{{}_3 C_2}{{}_5 C_2} = \frac{3}{10} \notag \\
\end{align}\]
\(X\) の確率分布は次の表のようになる。

\(X\)\(0\)\(1\)\(2\)
\(P\)\(\frac{1}{10}\)\(\frac{3}{5}\)\(\frac{3}{10}\)\(1\)

\(Y\) の確率分布も \(X\) と同様である。
\[\begin{align}
E(X) &= 0 \times \frac{1}{10} + 1 \times \frac{3}{5} + 2 \times \frac{3}{10} = \frac{6}{5} \notag \\
E(Y) &= E(X) = \frac{6}{5}
\end{align}\]

(2)
\[
E(2X + Y) = 2 E(X) + E(Y) = 2 \times \frac{6}{5} + \frac{6}{5} = \frac{18}{5}
\]

(3) \(X, Y\) は互いに独立であるから
\[
E(XY) = E(X) E(Y) = \left( \frac{6}{5} \right)^2 = \frac{36}{25}
\]

(4)
\[\begin{align}
E(X^2) &= 0^2 \times \frac{1}{10} + 1^2 \times \frac{3}{5} + 2^2 \times \frac{3}{10} = \frac{9}{5} \notag \\
V(X) &= E(X^2) \ – \ \{E(X)\}^2 = \frac{9}{5} – \left( \frac{6}{5} \right)^2 = \frac{9}{25} \notag \\
V(Y) &= V(X) = \frac{9}{25} \notag
\end{align}\]
\(X, Y\) は互いに独立であるから
\[\begin{align}
V(X + Y) &= V(X) + V(Y) = \frac{18}{25}
\end{align}\]

参考

高等学校数学B/確率分布と統計的な推測 - Wikibooks
タイトルとURLをコピーしました