削除された内容 追加された内容
編集の要約なし
新規作成 (会話 | 投稿記録)
m編集の要約なし
1行目:
[[File:Comparison standard deviations.svg|thumb|350px|共通の[[平均]]を持つが、異なる標準偏差を持つ標本の[[ヒストグラム]]例。赤で示された標本の標準偏差の方が青で示された標本の標準偏差よりも小さい。]]
[[File:Standard deviation diagram.svg|thumb|350px|平均 0, 標準偏差 σ の[[正規分布]]の[[確率密度関数]]。この分布に従う確率変数が 0 ± σ の間に値をとる確率はおよそ 68[[パーセント|%]] であることが読み取れる。]]
'''標準偏差'''(ひょうじゅんへんさ、{{Lang-en-short|standard deviation, SD}}、SD)は、日本工業規格では、[[分散]]の正の[[平方根]]と定義している<ref>[[{{sfn|JIS Z 8101]]-1 : 1999|loc=1.13 分散}}。データや[[統計確率変数]]の散らばり具合(ばらつき)を表す数値のひとつ。物理学{{sfn|伏見|loc=第 VII 用語と記号 − 第1部:[[確率]]及び一般統計用語 1.1363節 分散,算術平均、標準偏差|p=364 [[日本規格協}}、経済学、社]],学などでも使う。例えば、ある試験でクラス全員が同じ点数であった場合(すなわち全員が平均値であった場合)、データにはばらつきがないので、標準偏差は http://kikakurui.com/z8/Z8101-1-1999-01.html</ref>0 になる。
。データや[[確率変数]]の散らばり具合(ばらつき)を表す数値のひとつ。物理学<ref>[[伏見康治]]「[[確率論及統計論]]」第 VII 章 確率と統計 63節 算術平均、標準偏差 p.364 http://ebsa.ism.ac.jp/ebooks/ebook/204</ref>、経済学、社会学などでも使う。例えば、ある試験でクラス全員が同じ点数であった場合(すなわち全員が平均値であった場合)、データにはばらつきがないので、標準偏差は 0 になる。
 
[[母集団]]や確率変数の標準偏差を <var>σ</var> で、[[標本]]の標準偏差を ''s'' で表すことがある。[[二乗平均平方根]] (RMS) と混同されることもある。両者の差異については、[[二乗平均平方根]]を参照
[[二乗平均平方根]] (RMS) と混同されることもある。両者の差異については、[[二乗平均平方根]]を参照。
 
== 母集団の標準偏差 ==
''n'' 個のデータ ''x''<sub>1</sub>, ''x''<sub>2</sub>, ..., ''x''<sub>''n''</sub> からなる[[母集団]]を考える。その母集団の[[平均#相加平均|平均]](または母平均) &mu; は、次のとおりに定義される:
{{Indent|:<math>\mu = \frac{1}{n} \sum_{i=1}^{n}x_i.</math>.}}
このとき、母平均 &mu; を使って次式で得られる量 &sigma;<sup>2</sup> を[[分散]](または[[母分散]])と定義する。
{{Indent|:<math>\sigma^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i - \mu)^2 .</math>}}
この分散の[[平方根]] σ を、母集団の'''標準偏差'''と定義する<ref name="K">{{harvnb|栗原|2011|p={{google books quote|id=r5JIE8QbPbAC|page=47|47}}}}</ref>。分散はデータの散らばり具合を表す量であるとはいうものの、元のデータを2乗しているので、元のデータや平均値と単位が異なるため直接比較することができない。そこで平方根をとると元のデータと同じ単位になるので、分散よりも標準偏差の方が散らばり具合を表す量として便利なことがある{{sfn|稲垣|1990|p=21}}。
 
== 標本の標準偏差 ==
[[母集団]]の中から, ''n'' 個のデータ ''x''<sub>1</sub>, ''x''<sub>2</sub>, ..., ''x''<sub>''n''</sub> からなる[[標本]]を抽出したとする。このとき、標本平均を次式で定義する:
{{Indent|:<math>\bar{x} = \frac{1}{n} \sum_{i=1}^{n}x_i.</math>}}
この標本平均を使って次式で定義される量を標本の分散と呼ぶ。
{{Indent|:<math>s^2 = \frac{1}{n} \sum_{i=1}^{n}(x_i - \bar{x})^2 .</math>}}
標本の分散の平方根 ''s'' を標本の'''標準偏差'''と呼ぶ<ref name="K" />。
 
''σ''<sup>2</sup> を母集団の分散、''s''<sup>2</sup> を標本の分散とすると、
{{Indent|:<math>E[s^2] = \frac{n-1}{n} \sigma^2 </math>}}
となることが示される。つまり、標本の分散は母集団の分散よりも小さくなる傾向がある<ref>例えば、標本サイズが1の場合、ばらつきがないので標本の分散は必ず0となるが、母集団のばらつきは通常0ではない。</ref>。そのため、標本の分散は母集団の分散の[[偏り#推定量の偏り|不偏推定量]]ではない。そこで、
{{Indent|:<math>u^2 = \frac{1}{n-1} \sum_{i=1}^{n}(x_i - \bar{x})^2 </math>}}
を考えると、この量の期待値は母集団の[[分散]]に等しく、分散の不偏推定量になっている。こうして定義される ''u''<sup>2</sup> を[[分散#不偏分散|不偏分散]]という。'''標本分散'''と呼ぶこともある。
 
''u''<sup>2</sup> の[[平方根]] ''u'' を'''標本標準偏差'''ということもある。
 
不偏分散の平方根 ''u'' は、標準偏差の不偏推定量ではない。例えば母集団が[[正規分布]]に従う場合、標準偏差の不偏推定量 ''D'' は次式で与えられる{{sfn|吉澤|1989|pp=78-7978–79}}。
{{Indent|:<math> D = \sqrt{ \frac{n-1}{2}} \frac{ \Gamma \left( \frac{n-1}{2} \right) }{ \Gamma \left( \frac{n}{2} \right)} u.</math>}}
ここで、&Gamma; は[[ガンマ関数]]、''u''<sup>2</sup> は不偏分散である。
 
標本サイズが大きくなれば、標準偏差の不偏推定量 ''D'' は、近似的に、平均からの偏差平方和を <math>n-1.5</math> で割った値の平方根として求められる{{sfn|Brugger|1969|p=32}}。
{{Indent|:<math> D \approx \sqrt{\frac{1}{n-1.5} \sum_{i=1}^n(x_i - \bar{x})^2}.</math>}}
 
=== 名称の混乱 ===
統計の教科書によっては <var>n</var>-1 で割ったものが標本分散という名称になっており<ref>例: {{harv|東京大学教養学部統計学教室編|1991}}。</ref>、用語が混乱して使用されている場合がある。母平均が不明であって、代わりに標本平均を使用する場合には、期待値が母分散となる不偏分散を使用することが多い<ref>分散または標準偏差の図による解説と具体例は、{{Harv|村瀬|高田|廣瀬|2007|pp=52-5352–53}}などを参照。</ref>。
 
====英語====
英語では不偏分散による標準偏差のことを「{{外語ルビ|en|sample standard deviation|サンプル・スタンダード・デビエーション}}」(標本標準偏差)と呼ぶことが多い。この語は[[カール・ピアソン]]によって1893年に導入された<ref>{{cite web
|url= http://jeff560.tripod.com/s.html
|title= Earliest Known Uses of Some of the Words of Mathematics (S)
46 ⟶ 44行目:
}}</ref>。ただし不偏分散による標準偏差を意味する英語の表現には混乱がある。
 
*ウィキペディア英語版の「[[:en:standard deviation|{{lang|en|standard deviation}}]]」という記事では、不偏分散による標準偏差(平均からの偏差平方和を ''n-'' − 1 で割った値の平方根)のことを「{{外語ルビ|en|corrected sample standard deviation|コレクティド・サンプル・スタンダード・デビエーション}}」と表記し、平均からの偏差平方和をnで割った値の平方根を「{{外語ルビ|en|uncorrected sample standard deviation|アンコレクティド・サンプル・スタンダード・デビエーション}}」や「{{外語ルビ|en|the standard deviation of the sample|ジ・スタンダード・デビエーション・オブ・サンプルズ}}」と表記している<!--ウィキペディア英語版では、{{Interlang|en|Unbiased estimation of standard deviation}}の項目で、標準偏差の不偏推定量が説明されている。-->{{出典無効|date=2016年1月|title=WP:CIRCULAR参照}}<!-- 出典というよりは補足だけれども、あまり良い記述の仕方ではない -->
*アメリカの {{外語ルビ|en|Fundamentals of Engineering|ファンダメンタルズ・オブ・エンジニアリング}} (FE)}} の試験問題での「{{lang|en|sample standard deviation}}」は <var>''n</var>-'' − 1 で割る方を意味する。
*アメリカ・ユタ大学の[http://www.psych.utah.edu/malloy/ トム・マロイ]は、統計学の学習者向けウェブページ<ref>「{{外語ルビ|en|[http://www.psych.utah.edu/aoce/web-text/Estimating-Parameters99-12-15/ Estimating Parameters Web Page]|エスティメイティング・パラメターズ・ウェブ・ページ}}」</ref>では、「{{lang|en|sample standard deviation}}」を平均からの偏差平方和を ''n'' で割った値の平方根だと解説している。
 
====日本語====
57 ⟶ 55行目:
*東北学院大学の根市一志による資料<ref>「[http://www.tscc.tohoku-gakuin.ac.jp/~neichi/lectures/statistics/estimate.pdf 標準偏差の不偏性]」</ref>では後者である。
 
このように、同じ用語でも話者によって定義が異なるので注意が必要である。<!--ウィキペディア英語版では、{{Interlang|en|Unbiased estimation of standard deviation}}の項目で、標準偏差の不偏推定量が説明されている。-->{{出典無効|date=2016年1月|title=WP:CIRCULAR参照}}<!-- 出典というよりは補足だけれども、あまり良い記述の仕方ではない -->
 
== 確率変数の標準偏差 ==
81 ⟶ 79行目:
 
== 標準偏差の推定 ==
母標準偏差が未知のときは、標本から得られた標本標準偏差から推定することができる。母標準偏差を &sigma;、標本サイズ ''N'' の標本標準偏差を ''s'' とすると母集団分布が正規分布ならば &sigma;<sup>2</sup> は次の自由度 ''N'' - 1 の [[カイ二乗分布|&chi;<sup>2</sup> 分布]]に従う。
:<math>\chi^2=Ns^2/\sigma^2.</math>
&sigma; の推定値の95%信頼限界は ''P'' = 0.975 の &chi;<sup>2</sup> から ''P'' = 0.025 の &chi;<sup>2</sup> までの範囲で、''s'' と &sigma; の比は ''N'' = 5 では 0.31 から 1.49、''N'' = 20 では 0.67 から 1.28 となり、標本が小さい場合はかなり範囲が広いことに留意すべきである。
 
119 ⟶ 117行目:
|ref = harv
}}
* {{Cite book|和書|author=西岡康夫|year=2013|title=数学チュートリアル やさしく語る 確率統計|publisher=[[オーム社]]|isbn=9784274214073|ref=harv}}
* {{Cite book|和書|authorlast=伏見|first=康治|authorlink=[[伏見康治]]|year=1942|title=[[確率論及統計論]]|publisher=[[河出書房]]|isbn=9784874720127|url= http://ebsa.ism.ac.jp/ebooks/ebook/204|ref=harv}}
* {{Cite book|和書|authoreditor=[[日本数学会]]|year=2007|title=数学辞典|publisher=[[岩波書店]]|isbn=9784000803090|ref=harv}}
* [[{{citation | title=JIS Z 8101]]-1:1999 [[統計]] [[用語]][[記号]] 第1部:[[確率]]及び一般統計用語, [[| author=日本規格協会]], | authorlink=日本規格協会 | url=http://kikakurui.com/z8/Z8101-1-1999-01.html | ref={{sfnref|JIS Z 8101-1:1999}}}}
 
{{refend}}