メインメニューを開く

カイ二乗分布(カイにじょうぶんぷ、カイじじょうぶんぷ)、またはχ2分布確率分布の一種で、推計統計学で最も広く利用されるものである。ヘルメルトにより発見され[1]ピアソンにより命名された[2]

カイ二乗分布
確率密度関数
Probability density plots of gamma distributions
累積分布関数
Cumulative distribution plots of gamma distributions
母数
[0, ∞)
確率密度関数
累積分布関数
期待値 k
中央値
最頻値 0 for k < 2
k − 2 for k ≥ 2
分散 2k
歪度
尖度 12/k
エントロピー k/2 + ln 2 + ln Γ(k/2)
+ (1 − k/2)ψ(k/2)
モーメント母関数
特性関数
テンプレートを表示

独立に標準正規分布に従う k 個の確率変数 X1, …, Xk をとる。このとき、統計量

の従う分布のことを自由度 k のカイ二乗分布と呼ぶ。この分布は自由度 k に応じて右図のような形をとる。図を見れば分かるように、どの自由度 k でも、ある一定以上 Z が大きいならば、Z が大きいほどその確率が低くなることが分かる。このことは、大まかに言えば、「正規分布でランダムで値をとったのであるから、その値を用いて高々二乗和をとった程度の数値 Z がとてつもなく大きくなる確率は少ないはずである」と解釈できる。統計的仮説検定にカイ二乗分布が用いられるのはこの性質のためである。例えば、「データが意味のないノイズ要素である可能性はたったの5%以下であるから、このデータには意味があるはずである」という解釈が行われる。

普通はこれを

と書く。カイ二乗分布は k という1個の母数をもつ。これは Xi自由度に等しい正の整数である(場合によっては非整数自由度のカイ二乗分布も用いられる)。カイ二乗分布はガンマ分布の特殊な場合に当たる。

カイ二乗分布はカイ二乗検定と総称される多くの検定法のほか、フリードマン検定などにも利用される。

目次

性質編集

カイ二乗分布の確率密度関数x ≥ 0 に対し

 

また x ≤ 0 に対し fk(x) = 0 という形をとる。ここで Γガンマ関数である。

分布関数

 

(ただし γ(k, z)不完全ガンマ関数)である。

 (ただし    はカイ二乗分布に従う独立な確率変数)とすると、 、つまり自由度で割って比をとるとF分布に従う。

 (自由度2)ならば、X は期待値 2指数分布に従う。

自由度 k のカイ二乗分布に従う確率変数の期待値k で、分散2k である。中央値は近似的に

 

となる。

カイ二乗分布は再生性を持つ。すなわち、  ならば、  となる。

正規分布による近似編集

  として、k が無限大に近づくと X の分布は正規分布に近づくが、近づき方はゆっくりしている(歪度  尖度 12/k)ため、X 自体より速く正規分布に近づく次の2つの方法が普通用いられる。

  •   は近似的に平均 2k − 1、分散 1 の正規分布に従う(ロナルド・フィッシャー)。
  •   は近似的に平均 1 − 2/9k、分散 2/9k の正規分布に従う(ウィルソンとヒルファティ、1931年)。

脚注編集

  1. ^ Helmert, F. R. (1875): Ueber die Berechnung des wahrscheinlichen Fehlers aus einer endlichen Anzahl wahrer Beobachtungsfehler, Zeitschrift für Mathematik und Physik, 20, 300-303, インターネットアーカイブzeitschriftfrma29runggoog/page/n287.
  2. ^ Pearson, K. (1900): On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it Can Reasonably Be Supposed to have Arisen from Random Sampling, Philosophical Magazine 5, 50, 157-175, doi:10.1080/14786440009463897.

関連項目編集