多項分布 (たこうぶんぷ、英 : multinomial distribution )は、確率論 において二項分布 を一般化した確率分布 である。
多項分布
確率質量関数
累積分布関数
母数
試行回数
n
>
0
{\displaystyle n>0}
(整数 ) 各試行の確率
p
1
,
⋯
,
p
k
{\displaystyle p_{1},\cdots ,p_{k}}
(
Σ
p
i
=
1
{\displaystyle \Sigma p_{i}=1}
) 台
x
i
∈
{
0
,
⋯
,
n
}
,
i
∈
{
1
,
⋯
,
k
}
{\displaystyle x_{i}\in \{0,\cdots ,n\},\,\,\,\,i\in \{1,\cdots ,k\}}
Σ
x
i
=
n
{\displaystyle \Sigma x_{i}=n}
確率質量関数
n
!
x
1
!
⋯
x
k
!
p
1
x
1
⋯
p
k
x
k
{\displaystyle {\frac {n!}{x_{1}!\cdots x_{k}!}}{p_{1}}^{x_{1}}\cdots {p_{k}}^{x_{k}}}
期待値
E
[
X
i
]
=
n
p
i
{\displaystyle E[X_{i}]=np_{i}}
分散
Var
[
X
i
]
=
n
p
i
(
1
−
p
i
)
{\displaystyle \operatorname {Var} [X_{i}]=np_{i}(1-p_{i})}
Cov
[
X
i
,
X
j
]
=
−
n
p
i
p
j
(
i
≠
j
)
{\displaystyle \operatorname {Cov} [X_{i},X_{j}]=-np_{i}p_{j}~~(i\neq j)}
モーメント母関数
(
∑
i
=
1
k
p
i
e
t
i
)
n
{\displaystyle {\biggl (}\sum _{i=1}^{k}p_{i}e^{t_{i}}{\biggr )}^{n}}
特性関数
(
∑
j
=
1
k
p
j
e
i
t
j
)
n
{\displaystyle \left(\sum _{j=1}^{k}p_{j}e^{it_{j}}\right)^{n}}
where
i
2
=
−
1
{\displaystyle i^{2}=-1}
テンプレートを表示
二項分布は、n 個の独立なベルヌーイ試行 の「成功」の数の確率分布 であり、各試行の「成功」確率は同じである。多項分布では、各試行の結果は固定の有限個(k 個)の値をとり、それぞれの値をとる確率は p 1 , …, pk (すなわち、i = 1, …, k について pi ≥ 0 であり、
∑
i
=
1
k
p
i
=
1
{\displaystyle \textstyle \sum \limits _{i=1}^{k}p_{i}=1}
が成り立つ)であり、n 回の独立した試行が行われる。確率変数 Xi は n 回の試行で i という数が出る回数を示す。X = (X 1 , …, Xk ) は n と p をパラメータとする多項分布に従う。
多項分布の確率質量関数 は次の通りである。
f
(
x
1
,
⋯
,
x
k
;
n
,
p
1
,
⋯
,
p
k
)
=
{
n
!
x
1
!
⋯
x
k
!
p
1
x
1
⋯
p
k
x
k
when
∑
i
=
1
k
x
i
=
n
0
otherwise.
{\displaystyle f(x_{1},\cdots ,x_{k};n,p_{1},\cdots ,p_{k})={\begin{cases}{\dfrac {n!}{x_{1}!\cdots x_{k}!}}p_{1}^{x_{1}}\cdots p_{k}^{x_{k}}&{\text{when }}\sum \limits _{i=1}^{k}x_{i}=n\\[1ex]0&{\text{otherwise.}}\end{cases}}}
ここで、x 1 , …, xk は負でない整数である。
期待値 は次の通り。
E
[
X
i
]
=
n
p
i
.
{\displaystyle \operatorname {E} [X_{i}]=np_{i}.}
共分散行列 は次の通りである。対角線上のエントリは二項分布確率変数の分散 であるから、次のようになる。
var
[
X
i
]
=
n
p
i
(
1
−
p
i
)
.
{\displaystyle \operatorname {var} [X_{i}]=np_{i}(1-p_{i}).}
対角線以外のエントリは共分散 であり、次のようになる。
cov
[
X
i
,
X
j
]
=
−
n
p
i
p
j
{\displaystyle \operatorname {cov} [X_{i},X_{j}]=-np_{i}p_{j}}
ここで、i ≠ j である。
共分散は全体として負となる。なぜなら、N が固定であるとき多項ベクトルで1つが増加すると他が減少するためである。
これは、k × k の非負値定符号行列であり、行列の階数 は k − 1 である。
対応する相関行列の対角線以外のエントリは以下のようになる。
ρ
[
X
i
,
X
j
]
=
−
p
i
p
j
(
1
−
p
i
)
(
1
−
p
j
)
.
{\displaystyle \rho [X_{i},X_{j}]=-{\sqrt {\frac {p_{i}p_{j}}{(1-p_{i})(1-p_{j})}}}.}
この表現では標本サイズ n が出現しない点に注意されたい。
k 個の要素それぞれは n と pi (i 番目の要素に対応する確率)をパラメータとする二項分布となる。
多項分布のサポートは集合
{
(
n
1
,
⋯
,
n
k
)
∈
N
k
∣
n
1
+
⋯
+
n
k
=
n
}
{\displaystyle \{(n_{1},\cdots ,n_{k})\in \mathbb {N} ^{k}\mid n_{1}+\cdots +n_{k}=n\}}
である。その要素数は
(
n
+
k
−
1
k
−
1
)
=
⟨
n
k
⟩
{\displaystyle {\binom {n+k-1}{k-1}}=\left\langle {\begin{matrix}n\\k\end{matrix}}\right\rangle }
である(重複組合せ )。