「シンプソンのパラドックス」の版間の差分

m
編集の要約なし
m
上の話では、A君とB君の状況を先ほどのテストの話から何も改変していない。これらの問題は近年の文献でシンプソンのパラドックスとして議論された問題である。
 
=== シンプソン自身が提示した例<ref name=simpson></ref> ===
トランプの 52 枚のカードについて、絵札かどうか(ジャック、クイーン、キングのいずれかかどうか)と色(スペードとクラブなら黒、ハートとダイヤなら赤)との関連を考える。
さっきまで赤ちゃんがこのトランプで遊んでいたので、そのうち 20 枚ほどが汚れてい
汚れたカードだけみても汚れていないカードだけみても、絵札以外の方が、赤いカードである可能性が高いことが分かった。
では「絵札以外の方が、赤いカードである可能性が高い」といっ結論づけていいのか?
カード全体を見渡して考えることで「分別のある解答」(sensible answer)が得られる。
すなわち、そのような関係はない。
{{Col-end}}
 
関連性の逆転については言及されていない。
この例に対し、{{仮リンク|Miguel Hernán|en|Miguel Hernán}} は、Simpson 自身の記述の曖昧さを指摘しつつも、以下のような解釈を与えている<ref name=hernan>{{Cite journal|last = Hernán|first = Miguel A|date = 31 March 2011|year = 2011|month = June|title = The Simpson's paradox unraveled |journal = International Journal of Epidemiology|volume = 40|issue = 3|pages = 780-785|publisher = |location = |issn = |doi = 10.1093/ije/dyr041|naid = |pmid = 21454324 |id = |url = https://doi.org/10.1093/ije/dyr041|format = |accessdate = 2020-10-17|quote = }}</ref>。
 
トランプの例では、汚れの有無(C)は絵札か否か(A)とカードの色(B)の共通の結果、すなわち[[合流点]]である。
治療の例では、性別(C)は治療の有無(A)と生死(B)の共通の原因、すなわち[[交絡因子]]である。
トランプの例では、合流点による[[選択バイアス]]を避けるためにカード全体を見渡すべきだし、治療の例では、[[交絡]]を避けるために性別で層別化して考えるべきだ。
ただし、C が A と関係せずに B の原因となるとき、例えば無作為割付がなされた場合には、層別化する必要はない。
因果関係の方向性に基づいて解析手法を検討するが、因果関係の方向についてはそのテーマに関する因果構造の知識が必要である。
トランプのカードが汚れたからといって絵札になったり赤いカード(ハートまたはダイヤ)になったりすることはないし、治療したからとか生存したからといって男性になるようなことはない。
 
そして、次のように結論づけている<ref>{{Cite web |title=I thought I understood Simpson's paradox until I read Simpson’s paper. Turn out to be more interesting than expected|url=https://twitter.com/_MiguelHernan/status/860542619818106881 |accessdate=2020-10-17}}</ref>。
* 同じデータであっても異なる因果構造に起因するものであれば異なる解析が必要である。
* 実りのある因果推論を行うためには、統計学だけではなく、主題に関する因果関係の知識が必要だ。
 
{{デフォルトソート:しんふそんのはらとつくす}}
489

回編集