「シンプソンのパラドックス」の版間の差分

m
link
m
m (link)
'''シンプソンのパラドックス'''は[[1951年]]にE.H.シンプソンによって記述された[[統計学|統計学的]]な[[パラドックス]]である。
 
母集団での相関と母集団を分割した集団での相関は異なっている場合がある。
つまり[[母集団]]での[[相関]]と、母集団を2つにけた場合にある仮説が成立ても、集団全体は正反対仮説が成立す相関は、異なっていこと場合がある。
 
つまり集団を2つに分けた場合にある[[仮説]]が成立しても、集団全体では正反対の仮説が成立することがある。
 
== シンプソンのパラドックスの例 ==
 
例:A君とB君が1回目と2回目で合わせて110問を解くという[[試験|テスト]]を受けた。最初のテストでは、A君は100問を解き60問正解で、B君は10問中9問が正解であった。次のテストでは、A君は10問中1問、B君は100問中30問が正解だった。
 
この例について考えてみる。話を整理するためにいくつかの記号を導入する。
 
 
このように、計算方法によりパラドックスを見抜くことが出来る。しかし、依然として個人の成績と全体の成績の間には[[矛盾]]が残る。A君とB君のどちらが上なのだろうか?総得点に基づくとA君の方が上だと考えられる。しかし、次の例のようにB君の方が上であるかのように話を持って行くことは可能である。
 
A君とB君のどちらが上なのだろうか?
 
総得点に基づくとA君の方が上だと考えられる。しかし、次の例のようにB君の方が上であるかのように話を持って行くことは可能である。
:『A君とB君は病院で治療を行っている。中等症と重症の2群の患者に対する治療成績を2回テストした。結果は先ほどと同じ数値で考える。B君は両方の群でよりよい治療成績であったが、全体の治療成績は悪かった。その理由はB君の患者はほとんど重症であり(100/110)、A君の患者は殆どが軽症であったためである。A君の治療が良かったという結論は論理的に誤っている。』
 
上の話では、A君とB君の状況を先ほどのテストの話から何も改変していない。これらの問題は近年の文献でシンプソンのパラドックスとして議論された問題である
 
これらの問題は近年の文献でシンプソンのパラドックスとして議論された問題である。
統計学者にとっては1世紀以上前からこの現象は既知であったが、[[哲学]]者、[[コンピュータ]]を扱う科学者、[[疫学]]者、[[経済学]]者らは最近でもこのパラドックスに対する議論を行っている。
 
[[Category:統計学|しんふそんのはらとつくす]]