「信頼区間」の版間の差分

削除された内容 追加された内容
Yadane (会話 | 投稿記録)
編集の要約なし
m編集の要約なし
タグ: 2017年版ソースエディター
1行目:
{{出典の明記|date=2015年9月}}
'''信頼区間'''(しんらいくかん、{{Lang-en-short|Confidence interval, CI}})とは、[[母数空間]] &Theta; 上の関数 ''g'' : ''&Theta;'' &rarr; [[実数|'''R''']] が[[母数]] ''&theta;'' &isin; ''&Theta;'' でとる値 ''g''(''&theta;'') を統計的に推定するために用いられる区間。実数 0 &lt; ''&alpha;'' &lt; 1 と(観測できない)[[母数]] ''&theta;'' により定まる[[確率分布]] ''P'' = ''P''<sub>&theta;</sub>'' をもつ[[母集団]]からの[[標本 (統計学)|標本]] ''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> に関する[[統計量]] ''a'', ''b'' が不等式
:<math>P(a \leq g(\theta) \leq b) \geq 1 - \alpha </math>
を満たすとき、[[閉区間]] [''a'', ''b''] を ''g''(''&theta;'') の '''100(1 &minus; ''&alpha;'')% 信頼区間'''という。値 1 &minus; ''&alpha;'' (または 100(1 &minus; ''&alpha;'')%)は、'''信頼水準'''({{lang-en-short|confidence level}})または'''信頼係数'''({{lang-en-short|confidence coefficient}})と呼ばれ、慣習的には95%や99%(つまり ''&alpha;'' = 0.05, 0.01)などの数値を用いる。これを
:100(1 &minus; ''&alpha;'')% CI [''a'', ''b'']
と表記することもある。
 
9行目:
信頼区間は普通、標本から計算された統計量とともに与えられる。
-->
例えば「信頼水準95%で、投票者の35%から45%がA候補を支持している」といったとき、95%というのが信頼水準で、35%から45%というのが信頼区間、''g''(''θ'') に当たるのはA候補の支持率である。
 
2019年には科学者800人超が『''[[ネイチャー|Nature]]''』に署名を掲載し、誤って使われていることも多い「[[有意|統計的有意性]]」を使うのをやめて[[信頼区間]]を互換区間という言葉に言い換えて使用すべきだとされた<ref name="Nature800">{{Cite web |author=井上輝一 |date=2019-3-26 |url=https://www.itmedia.co.jp/news/articles/1903/26/news112.html |title=「“統計的に有意差なし”もうやめませんか」 Natureに科学者800人超が署名して投稿 |publisher=ITmedia |accessdate=2019-05-21}}</ref>。
35行目:
 
==具体例==
''X''<sub>1</sub>, ..., ''X''<sub>''n''</sub> を、[[平均]] ''μ''、[[分散 (確率論)|分散]] ''σ''<sup>2</sup> &gt; 0 の[[正規分布]]に従う[[母集団]]から抽出した[[独立 (確率論)|独立]]な標本とする。そこで[[標本平均]]と[[不偏分散]]をそれぞれ
:<math>\overlinebegin{Xalign}=(X_1+\cdots+X_n)/n</math>
:<math>S^2\overline{X} &= \frac{1}{n-1} \sum_{i=1}^{n\left(} X_i- \overline{X}\,\right)^2</math>
S^2 &= \frac{1}{n-1}\sum_{i=1}^n\left(X_i-\overline{X}\,\right)^2
\end{align}</math>
とおけば
:<math>T=\frac{\overline{X}-\mu}{S/\sqrt{n}}</math>
は自由度 ''n'' &minus; 1 の[[t分布]]に従う。
ここで ''T'' が従う分布は(観測できない)母数 ''&theta;'' = (''μ'', ''σ''<sup>2</sup>) にはよらないことに注意。
[[File:Confidence-interval.svg|right|300px]]
''t''<sub>''n''&minus;1</sub>(''&alpha;'') をこの分布の上側100''&alpha;''%点とすれば
:<math>P\big( -t_{n - 1}(\alpha/2) \leq T \leq t_{n - 1}(\alpha/2) \big) = 1 - \alpha</math>
となる。したがって
:<math>P\left( \overline{X} - t_{n - 1}(\alpha/2) \frac{S}{\sqrt{n}} \leq \mu \leq \overline{X} + t_{n - 1}(\alpha/2)\frac{S}{\sqrt{n}} \right) = 1 - \alpha</math>
が成り立ち、平均 ''g''(''&theta;'') = ''μ'' の 100(1 &minus; ''&alpha;'')% 信頼区間
:<math>\left[ \overline{X} - t_{n - 1}(\alpha/2) \frac{S}{\sqrt{n}},\quad \overline{X} + t_{n - 1}(\alpha/2) \frac{S}{\sqrt{n}} \right]</math>
が得られる。