「標準偏差」の版間の差分
削除された内容 追加された内容
Kaizen nagoya (会話 | 投稿記録) 編集の要約なし |
m編集の要約なし |
||
1行目:
[[File:Comparison standard deviations.svg|thumb|350px|共通の[[平均]]を持つが、異なる標準偏差を持つ標本の[[ヒストグラム]]例。赤で示された標本の標準偏差の方が青で示された標本の標準偏差よりも小さい。]]
[[File:Standard deviation diagram.svg|thumb|350px|平均 0, 標準偏差 σ の[[正規分布]]の[[確率密度関数]]。この分布に従う確率変数が 0 ± σ の間に値をとる確率はおよそ 68[[パーセント|%]] であることが読み取れる。]]
'''標準偏差'''(ひょうじゅんへんさ、{{Lang-en-short|standard deviation, SD}}
[[母集団]]や確率変数の標準偏差を <var>σ</var> で、[[標本]]の標準偏差を ''s'' で表すことがある。[[二乗平均平方根]] (RMS) と混同されることもある。両者の差異については、[[二乗平均平方根]]を参照。
== 母集団の標準偏差 ==
''n'' 個のデータ ''x''<sub>1</sub>, ''x''<sub>2</sub>, ..., ''x''<sub>''n''</sub> からなる[[母集団]]を考える。その母集団の[[平均#相加平均|平均]](または母平均) μ は、次のとおりに定義される:
このとき、母平均 μ を使って次式で得られる量 σ<sup>2</sup> を[[分散]](または[[母分散]])と定義する。
この分散の[[平方根]] σ を、母集団の'''標準偏差'''と定義する<ref name="K">{{harvnb|栗原|2011|p={{google books quote|id=r5JIE8QbPbAC|page=47|47}}}}</ref>。分散はデータの散らばり具合を表す量であるとはいうものの、元のデータを2乗しているので、元のデータや平均値と単位が異なるため直接比較することができない。そこで平方根をとると元のデータと同じ単位になるので、分散よりも標準偏差の方が散らばり具合を表す量として便利なことがある{{sfn|稲垣|1990|p=21}}。
== 標本の標準偏差 ==
[[母集団]]の中から, ''n'' 個のデータ ''x''<sub>1</sub>, ''x''<sub>2</sub>, ..., ''x''<sub>''n''</sub> からなる[[標本]]を抽出したとする。このとき、標本平均を次式で定義する:
この標本平均を使って次式で定義される量を標本の分散と呼ぶ。
標本の分散の平方根 ''s'' を標本の'''標準偏差'''と呼ぶ<ref name="K" />。
''σ''<sup>2</sup> を母集団の分散、''s''<sup>2</sup> を標本の分散とすると、
となることが示される。つまり、標本の分散は母集団の分散よりも小さくなる傾向がある<ref>例えば、標本サイズが1の場合、ばらつきがないので標本の分散は必ず0となるが、母集団のばらつきは通常0ではない。</ref>。そのため、標本の分散は母集団の分散の[[偏り#推定量の偏り|不偏推定量]]ではない。そこで、
を考えると、この量の期待値は母集団の[[分散]]に等しく、分散の不偏推定量になっている。こうして定義される ''u''<sup>2</sup> を[[分散#不偏分散|不偏分散]]という。'''標本分散'''と呼ぶこともある。
''u''<sup>2</sup> の[[平方根]] ''u'' を'''標本標準偏差'''ということもある。
不偏分散の平方根 ''u'' は、標準偏差の不偏推定量ではない。例えば母集団が[[正規分布]]に従う場合、標準偏差の不偏推定量 ''D'' は次式で与えられる{{sfn|吉澤|1989|pp=
ここで、Γ は[[ガンマ関数]]、''u''<sup>2</sup> は不偏分散である。
標本サイズが大きくなれば、標準偏差の不偏推定量 ''D'' は、近似的に、平均からの偏差平方和を <math>n-1.5</math> で割った値の平方根として求められる{{sfn|Brugger|1969|p=32}}。
=== 名称の混乱 ===
統計の教科書によっては <var>n</var>
====英語====
英語では不偏分散による標準偏差のことを「{{
|url= http://jeff560.tripod.com/s.html
|title= Earliest Known Uses of Some of the Words of Mathematics (S)
46 ⟶ 44行目:
}}</ref>。ただし不偏分散による標準偏差を意味する英語の表現には混乱がある。
*ウィキペディア英語版の「[[:en:standard deviation|{{lang|en|standard deviation}}]]」という記事では、不偏分散による標準偏差(平均からの偏差平方和を ''n
*アメリカの {{
*アメリカ・ユタ大学の[http://www.psych.utah.edu/malloy/ トム・マロイ]は、統計学の学習者向けウェブページ<ref>「
====日本語====
57 ⟶ 55行目:
*東北学院大学の根市一志による資料<ref>「[http://www.tscc.tohoku-gakuin.ac.jp/~neichi/lectures/statistics/estimate.pdf 標準偏差の不偏性]」</ref>では後者である。
このように、同じ用語でも話者によって定義が異なるので注意が必要である。
== 確率変数の標準偏差 ==
81 ⟶ 79行目:
== 標準偏差の推定 ==
母標準偏差が未知のときは、標本から得られた標本標準偏差から推定することができる。母標準偏差を σ、標本サイズ ''N'' の標本標準偏差を ''s'' とすると母集団分布が正規分布ならば σ<sup>2</sup> は次の自由度 ''N''
:<math>\chi^2=Ns^2/\sigma^2.</math>
σ の推定値の95%信頼限界は ''P'' = 0.975 の χ<sup>2</sup> から ''P'' = 0.025 の χ<sup>2</sup> までの範囲で、''s'' と σ の比は ''N'' = 5 では 0.31 から 1.49、''N'' = 20 では 0.67 から 1.28 となり、標本が小さい場合はかなり範囲が広いことに留意すべきである。
119 ⟶ 117行目:
|ref = harv
}}
* {{Cite book|和書|author=西岡康夫|year=2013|title=数学チュートリアル やさしく語る 確率統計|publisher=[[オーム社]]|isbn=9784274214073|ref=harv}}
* {{Cite book|和書|
* {{Cite book|和書|
*
{{refend}}
|