正規分布における偏差値の分布。T scoresが偏差値を示す。

偏差値(へんさち、: standard score)とは、データの値が、平均50、標準偏差10のデータに変換(正規化)したときに示す値のことである。無次元数である。

概要編集

偏差値とは、データ標準偏差(スケール)を一律10にし、平均50からどれだけ離れているかを示す指標である。偏差値は、データの分布が正規分布に近いことを前提としている。したがって、分布が正規分布から大きく外れる場合は、偏差値は必ずしも適切な指標とはいえない。

正規分布であるデータにおいて、平均50からの±10区間(40~60)は全体の約68.3%、±20区間(30~70)は約95.4%、±30区間(20~80)は約99.73%、±40区間(10~90)は約99.9937%、±50区間(0~100)は約99.999953%である[1]

  • 偏差値60以上(あるいは40以下)は、上位(下位)15.866%。
  • 偏差値70以上(あるいは30以下)は、上位(下位)2.275%。
  • 偏差値80以上(あるいは20以下)は、上位(下位)0.13499%。
  • 偏差値90以上(あるいは10以下)は、上位(下位)0.00315%。
  • 偏差値100以上(あるいは0以下)は、上位(下位)0.00002%。

例えば、全受験者数が100万人の学力試験の場合、偏差値80以上の者は、ほぼ1350人となる。(日本の実際の統計では、10代における同じ年齢の人口はおおよそ110〜120万人程度。40代は180〜200万人程度)

偏差値は全ての実数を取りうるが、偏差値が±50区間(0~100)を外れる割合は非常に低く、約0.000047%、つまり約200万分の1しかない。

数式による表記編集

データの値 xi に対する偏差値 Ti は次の式で定義される。

 

ここで、

 
N: データの大きさ、 xi: データの各値、 μx平均値、 σx標準偏差

なお、分子 xiμx偏差である。データの値 xi が平均値 μx に等しいときは、偏差が 0 となり、偏差値は 50 となる。また、データの全ての値 xi が等しいときは、標準偏差 σx = 0 となり、偏差値がこの式では定義できない。この場合、データの全ての偏差値を 50 とする。

応用例編集

脚注編集

関連項目編集