Table of Contents
多項分布の定義
Def: 多項分布(Multinomial distribution)
$(X_1, \cdots, X_k)$ の $(x_1, \cdots, x_k)$ における同時密度関数が
\[f(x_1, \cdots, x_k | n, p_1, \cdots, p_{k-1}) = \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\]と表現されるとき, これを多項分布という.
これが確率分布になることは, 多項定理より確認することができる
\[(p_1+\cdots + p_k)^n = \sum_D\frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\]どんなとき多項分布がでてくるの?
ある袋の中に, 赤玉: 5個, 青玉: 3個, 黒玉: 2個, 合計: 10個が入っているときにこの袋から6回復元抽出で1つの玉をランダムに 取り出す試行を考えます. なお, 同じ色の玉同士は区別できないとします. 取り出された赤, 青, 黒の個数を $(X_1, X_2, X_3)$とすると、この確率変数の組は多項分布に従い
\[f(x_1, x_2, x_3) = \frac{6!}{x_1!x_3!x_3!}\bigg(\frac{5}{10}\bigg)^{x_1}\bigg(\frac{3}{10}\bigg)^{x_1}\bigg(\frac{2}{10}\bigg)^{x_1}\]と確率分布を表現することができる.
共分散の導出
Proposition
$(X_1, \cdots, X_k)$が$(n, p_1, \cdots, p_k)$の多項分布に従うとき, $Cov(X_i, X_j)=-np_ip_j, (i\neq j)$となる
証明
\[\begin{align*} \mathbb E[X_iX_j] &= \sum x_ix_j \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\\ &= n(n-1)p_ip_j \sum_{x_1+\cdots+x_k=n-2} x_ix_j \frac{(n-2)!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\\ &= n(n-1)p_ip_j \end{align*}\]従って,
\[\begin{align*} Cov(X_i, X_j) &= n(n-1)p_ip_j - n^2p_ip_j \\ &= -np_ip_j \end{align*}\]証明終了
条件付き確率密度関数の導出
$(X_1, \cdots, X_k)$が$(n, p_1, \cdots, p_k)$の多項分布に従うとき, $X_k = x_k$が与えられたときの条件付き確率分布を計算したいとします.
\[\begin{align*} f(x_1, \cdots, x_{k-1}|x_k) &= \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\bigg/ \frac{n!}{(n-x_k)!v!}p_k^{x_k}(1 - p_k)^{n-x_k}\\ &= \frac{(n-x_k)!}{x_1!\cdots x_{k-1}!}\bigg(\frac{p_1}{1-p_k}\bigg)^{x_1}\cdots bigg(\frac{p_{k-1}}{1-p_k}\bigg)^{x_{k-1}} \end{align*}\]多項分布の周辺密度関数としての二項分布密度関数
Proposition
$(X_1, \cdots, X_k)$ が以下のような多項分布関数に従うとき,
\[f(x_1, \cdots, x_k | n, p_1, \cdots, p_{k-1}) = \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\]$X_v (1\leq v \leq k)$の確率分布を求めると二項分布になる
証明
$X_v$の周辺確率密度関数を $f_v(x)$と表現すると
\[f_v(x_v) = \frac{n!}{(n-x_v)!v!}p_v^{x_v}\sum\frac{(n-x_v)!}{x_1!\cdots x_{v-1}!x_{v+1}!\cdots x_k!}p_1^{x_1}\cdots p_{v-1}^^{x_{k-1}}p_{v+1}^{x_{v+1}}\cdots p_k^{x_k}\]多項定理より
\[\begin{align*} \sum\frac{(n-x_v)!}{x_1!\cdots x_{v-1}!x_{v+1}!\cdots x_k!}p_1^{x_1}\cdots p_{v-1}^^{x_{k-1}}p_{v+1}^{x_{v+1}}\cdots p_k^{x_k} &= (p_1+\cdots+p_{v-1}+p_{v+1}\cdots + p_{k})^{n-x_v}\\ &= (1 - p_v)^{n-x_v} \end{align*}\]従って
\[f_v(x_v) = \frac{n!}{(n-x_v)!v!}p_v^{x_v}(1 - p_v)^{n-x_v}\]すなわち, $X_v \sim Bin(n, p_v)$ となることがわかる.
証明終了
(注意:GitHub Accountが必要となります)