初めに
本記事では、同時分布の定義、確率変数の独立性、2変数以上の期待値、分散についてまとめる。
同時分布
定義(同時分布)
確率変数 \(X, Y\) と実数 \(a, b\) に対し、\(X = a, Y = b\) が同時に成り立つ確率を \(P(X = a, Y = b)\) と表す。
確率変数 \(X, Y\) の取りうる値とその確率との対応関係を \(X, Y\) の同時確率分布という。
確率変数 \(X\) の取りうる値を \(x_1, x_2, \cdots, x_m\), 確率変数 \(Y\) の取りうる値を \(y_1, y_2, \cdots, y_n\) とする。このとき、
\[
P(X = x_i, Y = y_j) = p_{ij} \ (i = 1, 2, \cdots, m, j = 1, 2, \cdots, n)
\]
を同時確率関数という。同時確率分布は次のように表される。
\(X\Y\) | \(y_1\) | \(y_2\) | \(\cdots\) | \(y_n\) | 計 |
\(x_1\) | \(p_{11}\) | \(p_{12}\) | \(\cdots\) | \(p_{1n}\) | \(p_{1}\) |
\(x_2\) | \(p_{21}\) | \(p_{22}\) | \(\cdots\) | \(p_{2n}\) | \(p_{2}\) |
\(\vdots\) | \(\vdots\) | \(\vdots\) | \(\ddots\) | \(\vdots\) | \(\vdots\) |
\(x_m\) | \(p_{m1}\) | \(p_{m2}\) | \(\cdots\) | \(p_{mn}\) | \(p_{m}\) |
計 | \(q_1\) | \(q_2\) | \(\cdots\) | \(q_n\) | \(1\) |
ところで、
\[\begin{align}
P(X = x_i) &= \sum_{j = 1}^n p_{ij} = p_i \ (i = 1, 2, \cdots, m) \notag \\
P(X = y_j) &= \sum_{i = 1}^m p_{ij} = q_j \ (j = 1, 2, \cdots, n)\notag \\
\end{align}\]
をそれそれ \(X, Y\) の周辺確率関数といい, その分布を周辺分布という。周辺分布は次のようになる。
\(X\) | \(x_1\) | \(x_2\) | \(\cdots\) | \(x_m\) | 計 |
\(P\) | \(p_{1}\) | \(p_{2}\) | \(\cdots\) | \(p_{m}\) | \(1\) |
\(Y\) | \(y_1\) | \(y_2\) | \(\cdots\) | \(y_n\) | 計 |
\(P\) | \(q_{1}\) | \(q_{2}\) | \(\cdots\) | \(q_{n}\) | \(1\) |
定義(確率変数の独立性)
確率変数 \(X, Y\) が取りうる値をそれぞれ \(x_i \ (i = 1, 2, \cdots, m)\), \(y_j \ (j = 1, 2, \cdots, n)\) とする。
すべての \(i, j\) において、
\[
P(X = x_i, Y = y_j) = P(X = x_i) P(Y = y_j)
\]
が成り立つとき、\(X, Y\) は独立であるという。
補足
2つの確率変数において、上記のように独立を定義したが、3つ以上の場合についても同様に定義される。
確率変数の期待値
実数 \(a, b\), 確率変数 \(X, Y\) において、次が成り立つ。
\[\begin{align}
E(a X + b Y) = a E(X) + b E(Y) \notag
\end{align}\]
また、\(X, Y\) が独立のとき、次が成り立つ。
\[
E(XY) = E(X)E(Y)
\]
証明
確率変数 \(X, Y\) が取りうる値をそれぞれ \(x_i \ (i = 1, 2, \cdots, m)\), \(y_j \ (j = 1, 2, \cdots, n)\) とする。また、同時確率関数を \(P(X = x_i, Y = y_j) = p_{ij}\) とする。
\[\begin{align}
E(a X + b Y) &= \sum_{i = 1}^m \sum_{j = 1}^n (a x_i + b y_j) p_{ij} \notag \\
&= \sum_{i = 1}^m \sum_{j = 1}^n a x_i p_{ij} + \sum_{i = 1}^m \sum_{j = 1}^n b y_j p_{ij} \notag \\
&= a \sum_{i = 1}^m x_i \sum_{j = 1}^n p_{ij} + b \sum_{j = 1}^n y_j \sum_{i = 1}^m p_{ij} \notag \\
&= a \sum_{i = 1}^m x_i p_i + b \sum_{j = 1}^n y_j q_j \notag \\
&= a E(X) + b E(Y) \notag
\end{align}\]
また、\(X, Y\) が独立のとき、\(p_{ij} = p_i q_j\) であるので
\[\begin{align}
E(XY) &= \sum_{i = 1}^m \sum_{j = 1}^n x_i y_j p_{ij} \notag \\
&= \sum_{i = 1}^m \sum_{j = 1}^n x_i y_j p_i q_j \notag \\
&= \sum_{i = 1}^m x_i p_i \sum_{j = 1}^n y_j q_j \notag \\
&= \sum_{i = 1}^m x_i p_i E(Y) \notag \\
&= E(Y) \sum_{i = 1}^m x_i p_i \notag \\
&= E(Y) E(X) \notag \\
&= E(X) E(Y) \notag
\end{align}\]
確率変数の和の分散、共分散
確率変数 \(X, Y\) において、次が成り立つ。
\[\begin{align}
Cov(X, Y) &= E(XY) – E(X)E(Y) \notag \\
V(X \pm Y) &= V(X) \pm Cov(X, Y) + V(Y) \notag
\end{align}\]
\(X\) と \(Y\) が独立のとき、次が成り立つ。
\[\begin{align}
Cov(X, Y) &= 0 \notag \\
V(X \pm Y) &= V(X) + V(Y) \notag
\end{align}\]
ところで、\(Cov(X, Y)\) は \(X\) と \(Y\) の共分散である。
証明
\(E(X) = \mu_x, E(Y) = \mu_y\) とする。
\[\begin{align}
Cov(X, Y) &= E((X – \mu_x)(Y – \mu_y)) \notag \\
&= E(XY – \mu_x Y – \mu_y X + \mu_x \mu_y) \notag \\
&= E(XY) – \mu_x E(Y) – \mu_y E(X) + E(\mu_x \mu_y) \notag \\
&= E(XY) – \mu_x E(Y) – \mu_y E(X) + \mu_x \mu_y \notag \\
&= E(XY) – E(X)E(Y) – E(Y)E(X) + E(X)E(Y) \notag \\
&= E(XY) – E(X)E(Y) \notag
\end{align}\]
また、
\[\begin{align}
V(X \pm Y) &= E((X \pm Y)^2) \ – \ \{E(X \pm Y)\}^2 \notag \\
&= E(X^2 \pm 2 XY + Y^2) \ – \ (E(X) \pm E(Y))^2 \notag \\
&= E(X^2) \pm 2 E(XY) + E(Y^2) \notag \\
& \ \ \ \ \ \ \ \ – \ (\{E(X)\}^2 \pm 2 E(X)E(Y) + \{E(Y)\}^2) \notag \\
&= (E(X^2) \ – \ \{E(X)\}^2) \pm 2 (E(XY) \ – \ E(X)E(Y)) \notag \\
& \ \ \ \ \ \ \ \ + (E(Y^2) \ – \ \{E(Y)\}^2) \notag \\
&= V(X) \pm Cov(X, Y) + V(Y) \notag
\end{align}\]
\(X\) と \(Y\) が独立のとき、\(E(XY) = E(X)E(Y)\) より
\[
Cov(X, Y) = E(XY) \ – \ E(X)E(Y) = E(X)E(Y) \ – \ E(X)E(Y) = 0
\]
である。これにより \(V(X \pm Y) = V(X) + V(Y)\) は明らか。
練習問題
練習問題1
問題
1枚のコインを投げる試行と1個のサイコロを振る試行同時に行った。このとき、コインが表の場合 \(X = 0\), 裏の場合 \(X = 1\) とする。また、サイコロの出た目を \(Y\) とすると、\(X\) と \(Y\) の同時分布は次のようになる。次の問いに答えよ。
(1) 次の同時分布表を完成させよ。
\(X\Y\) | \(1\) | \(2\) | \(3\) | \(4\) | \(5\) | \(6\) | 計 |
\(0\) | |||||||
\(1\) | |||||||
計 |
(2) 周辺確率 \(P(X = 1)\)の値を答えよ。
解答
(1) すべての確率が \(\frac{1}{2} \times \frac{1}{6} = \frac{1}{12}\) であるため、次のようになる。
\(X\Y\) | \(1\) | \(2\) | \(3\) | \(4\) | \(5\) | \(6\) | 計 |
\(0\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{2}\) |
\(1\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{12}\) | \(\frac{1}{2}\) |
計 | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(\frac{1}{6}\) | \(1\) |
(2) 同時分布表より \(P(X = 1) =\frac{1}{2}\) である。
練習問題2
問題
白玉3個、赤玉2個が入った袋の中から同時に2個取り出して戻すことを2回行い、1回目と2回目に取り出す白玉の個数をそれぞれ \(X, Y\) とする。
(1) \(E(X)\) を求めよ。
(2) \(E(2X + Y)\) を求めよ。
(3) \(E(XY)\) を求めよ。
(4) \(V(X + Y)\) を求めよ。
解答
(1)
\[\begin{align}
P(X = 0) &= \frac{{}_2 C_2}{{}_5 C_2} = \frac{1}{10} \notag \\
P(X = 1) &= \frac{{}_3 C_1 \times {}_2 C_1}{{}_5 C_2} = \frac{6}{10} = \frac{3}{5} \notag \\
P(X = 2) &= \frac{{}_3 C_2}{{}_5 C_2} = \frac{3}{10} \notag \\
\end{align}\]
\(X\) の確率分布は次の表のようになる。
\(X\) | \(0\) | \(1\) | \(2\) | 計 |
\(P\) | \(\frac{1}{10}\) | \(\frac{3}{5}\) | \(\frac{3}{10}\) | \(1\) |
\(Y\) の確率分布も \(X\) と同様である。
\[\begin{align}
E(X) &= 0 \times \frac{1}{10} + 1 \times \frac{3}{5} + 2 \times \frac{3}{10} = \frac{6}{5} \notag \\
E(Y) &= E(X) = \frac{6}{5}
\end{align}\]
(2)
\[
E(2X + Y) = 2 E(X) + E(Y) = 2 \times \frac{6}{5} + \frac{6}{5} = \frac{18}{5}
\]
(3) \(X, Y\) は互いに独立であるから
\[
E(XY) = E(X) E(Y) = \left( \frac{6}{5} \right)^2 = \frac{36}{25}
\]
(4)
\[\begin{align}
E(X^2) &= 0^2 \times \frac{1}{10} + 1^2 \times \frac{3}{5} + 2^2 \times \frac{3}{10} = \frac{9}{5} \notag \\
V(X) &= E(X^2) \ – \ \{E(X)\}^2 = \frac{9}{5} – \left( \frac{6}{5} \right)^2 = \frac{9}{25} \notag \\
V(Y) &= V(X) = \frac{9}{25} \notag
\end{align}\]
\(X, Y\) は互いに独立であるから
\[\begin{align}
V(X + Y) &= V(X) + V(Y) = \frac{18}{25}
\end{align}\]