多項分布の周辺密度関数としての二項分布密度関数

公開日: 2023-02-26
更新日: 2023-03-10

  Table of Contents

多項分布の定義

Def: 多項分布(Multinomial distribution)

$(X_1, \cdots, X_k)$ の $(x_1, \cdots, x_k)$ における同時密度関数が

\[f(x_1, \cdots, x_k | n, p_1, \cdots, p_{k-1}) = \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\]

と表現されるとき, これを多項分布という.

これが確率分布になることは, 多項定理より確認することができる

\[(p_1+\cdots + p_k)^n = \sum_D\frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\]

どんなとき多項分布がでてくるの?

ある袋の中に, 赤玉: 5個, 青玉: 3個, 黒玉: 2個, 合計: 10個が入っているときにこの袋から6回復元抽出で1つの玉をランダムに 取り出す試行を考えます. なお, 同じ色の玉同士は区別できないとします. 取り出された赤, 青, 黒の個数を $(X_1, X_2, X_3)$とすると、この確率変数の組は多項分布に従い

\[f(x_1, x_2, x_3) = \frac{6!}{x_1!x_3!x_3!}\bigg(\frac{5}{10}\bigg)^{x_1}\bigg(\frac{3}{10}\bigg)^{x_1}\bigg(\frac{2}{10}\bigg)^{x_1}\]

と確率分布を表現することができる.

共分散の導出

Proposition

$(X_1, \cdots, X_k)$が$(n, p_1, \cdots, p_k)$の多項分布に従うとき, $Cov(X_i, X_j)=-np_ip_j, (i\neq j)$となる

証明

\[\begin{align*} \mathbb E[X_iX_j] &= \sum x_ix_j \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\\ &= n(n-1)p_ip_j \sum_{x_1+\cdots+x_k=n-2} x_ix_j \frac{(n-2)!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\\ &= n(n-1)p_ip_j \end{align*}\]

従って,

\[\begin{align*} Cov(X_i, X_j) &= n(n-1)p_ip_j - n^2p_ip_j \\ &= -np_ip_j \end{align*}\]

証明終了


条件付き確率密度関数の導出

$(X_1, \cdots, X_k)$が$(n, p_1, \cdots, p_k)$の多項分布に従うとき, $X_k = x_k$が与えられたときの条件付き確率分布を計算したいとします.

\[\begin{align*} f(x_1, \cdots, x_{k-1}|x_k) &= \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\bigg/ \frac{n!}{(n-x_k)!v!}p_k^{x_k}(1 - p_k)^{n-x_k}\\ &= \frac{(n-x_k)!}{x_1!\cdots x_{k-1}!}\bigg(\frac{p_1}{1-p_k}\bigg)^{x_1}\cdots bigg(\frac{p_{k-1}}{1-p_k}\bigg)^{x_{k-1}} \end{align*}\]

多項分布の周辺密度関数としての二項分布密度関数

Proposition

$(X_1, \cdots, X_k)$ が以下のような多項分布関数に従うとき,

\[f(x_1, \cdots, x_k | n, p_1, \cdots, p_{k-1}) = \frac{n!}{x_1!\cdots x_k!}p_1^{x_1}\cdots p_k^{x_k}\]

$X_v (1\leq v \leq k)$の確率分布を求めると二項分布になる

証明

$X_v$の周辺確率密度関数を $f_v(x)$と表現すると

\[f_v(x_v) = \frac{n!}{(n-x_v)!v!}p_v^{x_v}\sum\frac{(n-x_v)!}{x_1!\cdots x_{v-1}!x_{v+1}!\cdots x_k!}p_1^{x_1}\cdots p_{v-1}^^{x_{k-1}}p_{v+1}^{x_{v+1}}\cdots p_k^{x_k}\]

多項定理より

\[\begin{align*} \sum\frac{(n-x_v)!}{x_1!\cdots x_{v-1}!x_{v+1}!\cdots x_k!}p_1^{x_1}\cdots p_{v-1}^^{x_{k-1}}p_{v+1}^{x_{v+1}}\cdots p_k^{x_k} &= (p_1+\cdots+p_{v-1}+p_{v+1}\cdots + p_{k})^{n-x_v}\\ &= (1 - p_v)^{n-x_v} \end{align*}\]

従って

\[f_v(x_v) = \frac{n!}{(n-x_v)!v!}p_v^{x_v}(1 - p_v)^{n-x_v}\]

すなわち, $X_v \sim Bin(n, p_v)$ となることがわかる.

証明終了




Share Buttons
Share on:

Feature Tags
Leave a Comment
(注意:GitHub Accountが必要となります)