削除された内容 追加された内容
Ohaigasih (会話 | 投稿記録)
m編集の要約なし
1行目:
{{小文字|title=t検定}}
 
'''t検定'''(ティーけんてい)とは、[[帰無仮説]]が正しいと仮定した場合に、統計量が[[t分布]]に従うことを利用する[[統計学]]的[[検定法]]の総称である。[[母集団]]が[[正規分布]]に従うと仮定する[[パラメトリック検定法]]であり、t分布が直接もとの[[平均]]や[[標準偏差]]にはよらない(ただし[[自由度]]による)ことを利用している。2組の[[標本 (統計学)|標本]]について平均に有意差があるかどうかの検定などに用いられる。
 
14 ⟶ 13行目:
 
==方法==
===一群のt検定===
母集団の平均値''μ''が特定の値である ''μ''<sub>0</sub>と等しいかどうかの帰無仮説を検定する際に使用する。
 
26 ⟶ 25行目:
: <math> Y_i = \alpha + \beta x_i + \varepsilon_i, </math>
 
''x''<sub>''i''</sub>, ''i''&nbsp;=&nbsp;1,&nbsp;...,&nbsp;''n''は既存の説明変数であり、 ''α'' と ''β''は未知の係数である。そして ''ε''<sub>''i''</sub>は独立に同一の正規分布に従った期待値0で未知の分散''σ''<sup>2</sup>であるランダムな誤差とする。 ''Y''<sub>''i''</sub>, ''i''&nbsp;=&nbsp;1,&nbsp;...,&nbsp;''n''は観測値である。この際、 ''β''がある特定の値''β''<sub>0</sub>と等しいかどうかをテストしたい (多くの場合''β''<sub>0</sub>は 0である。何故なら、''β''が0であれば''x'' と ''y'' に相関性が無いと言う事になり、0以外の値であれば''x'' と ''y'' は相関しているということになる)。
: <math>
\begin{align}
37 ⟶ 36行目:
t_\text{score} = \frac{\widehat\beta - \beta_0}{ SE_{\widehat\beta} }
</math>
帰無仮説が正しければ、この数値はt値の自由度が''n''&nbsp;&minus;&nbsp;2に従う。
 
: <math>
57 ⟶ 56行目:
一つ目の母集団の平均値''μ''<sub>1</sub>が二つ目の母集団の平均値''μ''<sub>2</sub>と等しいかどうかの帰無仮説を検定する際に使用する。言い換えると''μ''<sub>1</sub>-''μ''<sub>2</sub>=0かどうかの帰無仮説を検定する。
 
====t検定を始める前に====
実務的なデータ分析では、母集団が様々な前提を満たしているかどうかを調べるため、以下のような検定をt検定の前段階に行う場合がある。
* 標本が正規分布に従うかどうかは、[[コルモゴロフ-スミルノフ検定]]や[[シャピロ-ウィルク検定]]などの正規性検定によって判断する事もできる。
82 ⟶ 81行目:
t分布の自由度''&nu;''は、
:<math>\nu=\frac{(\frac{U_x}{m}+\frac{U_y}{n})^2}{\frac{U_x^2}{m^2(m-1)}+\frac{U_y^2}{n^2(n-1)}}</math>
であるが、これは[[整数]]になるとは限らないので、10未満の場合は[[小数]]自由度のt分布表を利用する。10以上ならば小数部を切り捨て整数部のみを使用してよい。
 
===関連二組の差の平均値のt検定===
''n'' 対のデータがあるとし、対応する2変数を''X<Subsub>i</Subsub>'' と''Y<Subsub>i</Subsub>'' 、両者の差を''d<Subsub>i</Subsub>'' = ''X<Subsub>i</Subsub>'' - ''Y<Subsub>i</Subsub>'' とする(''i'' = 1, 2, ... , ''n'')。''d<Subsub>i</Subsub>'' の平均を<math>\overline{X}_D</math>とする。差の母集団の平均値''μ''<sub>d</sub>が特定の値である ''μ''<sub>0</sub>と等しいかどうかの帰無仮説を検定する際に使用する。
 
検定統計量 ''t<Subsub>0</Subsub>'' を
:<math>t = \frac{\overline{X}_D - \mu_0}{s_D/\sqrt{n}}. </math>
により算出する。
93 ⟶ 92行目:
 
==t検定の代替手段==
t検定は、母集団が正規分布をしており標本の分散がχ<sup>2</sup> 分布をしているという前提の下において、「完全に」正確な確率を計算することができる(ウェルチ検定では「ほぼ」正確な値を計算できる)。逆の言い方をすると、母集団が正規分布に従っていない場合は、標本平均はt値からは多かれ少なかれ乖離する。実務的に標本から母集団が正規分布をしているかどうかという事を判断する事は、色々な検定方法があるとは言う物の、非常に困難である。ただし、中心極限定理によると、母集団の分布が正規分布に従わない標本でさえも、サンプル数が多くなればなるほど、標本平均は正規分布に近似していく。従って、標本サイズが多ければ多いほど、標準検定値である<math>\frac{\bar{X}}{\frac{\sigma}{\sqrt{n}}}</math>はZ値に近似することになる。このような基礎に基づくと、母集団が正規分布から完全に逸脱した分布に従っていて、標本サイズが十分に大きな場合(大学の初等の統計の教科書などではn>30n>30などと載っている場合があるが、勿論多ければ多いほど良い)、Z検定で近似的な確率を計算できる。ただしt値は自由度が上がるとZ値に近似するため、計算上はt検定を用いても殆ど大差ない結果を得られる(哲学的には異なるが)。それがt検定が頑強(robust)であると言われる所以である。
 
===ノンパラメトリック手法===
t検定は母集団の正規分布を前提とするパラメトリック検定であるが、この条件が満たされず、さらに標本サイズが小さいと、t検定で近似することも困難となる。そういった場合には[[ノンパラメトリック検定]]を用いる方法がある。ノンパラメトリック検定は汎用性を重視し、効率性を犠牲にしているというものの、場合によっては統計のパワー(1 − β)がt検定に比べてはるかに高い。
* 標本が独立ならば[[マン・ホイットニーのU検定]]など
* 対になる標本ならば[[ウィルコクソンの符号順位検定]]など
を用いる事ができる。ただしt検定やZ検定が母集団の平均値に注目して仮説を立てるのに対して、ノンパラメトリック検定ではランキング、中央値や分布などに注目して仮説を立てる事に注意が必要。
 
[[Category{{DEFAULTSORT:統計検定|ていいけんてい]]}}
[[Category:統計検定]]
[[Category:数学に関する記事|Tていいけんてい]]