「ノンパラメトリック手法」の版間の差分

削除された内容 追加された内容
Glucose (会話 | 投稿記録)
編集の要約なし
1行目:
統計学において、'''ノンパラメトリックの手法'''は[[母集団]]の[[分布]]について一切の仮定前提を設けないものをいう。このため、分布に関わらない手法(distribution-free method) と呼ばれることもある。
 
== 応用と目的 ==
パラメトリック曲線とは、[[母数|パラメータ]]で決まる曲線のことである。パラメータとは「連続する値を持つ変数」のことである。一般的に、[[統計検定]]では[[正規分布関数]]の曲線が使われる。 しかし特に標本サイズが小さい場合には、それから求められた[[統計量]]の[[分布型]]は不正確なことが多く、パラメトリックな手法([[t検定]]、[[分散分析]]など)を適用することは不適切になりやすい。たとえばコインを4回投げてその表裏の分布を統計的に検討しようとしても不適切である。しかし、ノンパラメトリックな手法は常に適用可能である。なぜなら前提が少ないからである。逆に正規分布している母集団の検定では、差があるといいにくいという点は必然的に発生する。
ノンパラメトリック手法は[[順序尺度]](例えばレストランの人気ランキングなど)を分析する際に良く使われる。ランキングには順序が反映されるものの、はっきりとした数値([[比率尺度]]や[[間隔尺度]])を提供されない場合が多い。[[尺度水準]]と言う点で、ノンパラメトリック手法は順序尺度に基づくものである。
 
少数のサプルから統計的検定を行おうとすると、パラメトリック手法はパラメトリック手法と比べて不正確な結果ほとんど前提出す場合も多必要としない。また近年コンピュータの発達によりため、ノンパラメトリック手法が容易は広き計算わたり適用できるよう。事前なったこと詳しい事解ってないデータや、[[社会科学]]や[[心理学]]おけるアンケート調査の分析ってどにおて、ノンパラメトリック手法は広く使用される。
ノンパラメトリック手法はどのような場合にも妥当であるため、頑強性がある。ただし、その頑強性にはコストも生じる。ノンパラメトリック検定は、対応するパラメトリック検定(もし前提条件が満たされていれば)と比べて「パワー」が弱い。つまりパラメトリック検定と同じ信頼を得ようとした場合、ノンパラメトリック手法ではより多くの標本数を要することになる。パラメトリックとノンパラメトリックの両方が使用できる場合は、頑強性と効率性の間でのトレードオフが生ずる訳である。
[[中心極限定理]]によると、母集団の分布が正規分布に従わないと考えられる少数の標本では、標本平均が正規分布から遠く離れる。そのため[[t検定]]などを使うことが出来ず、ノンパラメトリックが数少ない分析手法となってしまう。生態学などにおいて少数の標本しか調査できない場合など、ノンパラメトリック分析が多く使われる。
 
== 各種のノンパラメトリック手法 ==