「分割表」の版間の差分

削除された内容 追加された内容
編集の要約なし
分割表の整形・追加ほか
1行目:
{{出典の明記|date=2016年3月}}
'''分割表'''([[英語|英]]: contingency table)は、[[統計学]]において、2つ以上の変数([[尺度水準#名義尺度|名義尺度]]が一般的)の間の関係を記録し分析するためのもの。
 
例えば、性別(男性と女性)と[[利き手]](右手と左手)という2つの変数があるとする。100人の無作為抽出した標本について、これら変数を観測する。すると、2つの変数の関係は次のように分割表で表すことができる。
{| class="wikitable" style="text-align:center; margin:0 auto"
<center>
|+ 2&times;2分割表の例
{| class="wikitable"
||! !! 右利き ||!! 左利き ||!!
|-----
|-
! 男性
|| 右利き || 左利き || 合計
| 男性 || 43 || 9 || 52
|-----
|-
| 男性 || 43 || 9 || 52
! 女性
|-----
| 女性 || 44 || 4 || 48
|-----
|! |
| 87 || 13 || 100
|}
|}</center>
 
この表で、右端の列を'''行周辺合計''' (row marginal total) 、下端の行を'''列周辺合計''' (column marginal total) と呼び、右下端の角にあたる部分を'''総計''' (grand total) と呼ぶ。
 
この表から、男性の右利きの割合と女性の右利きの割合には大差がないことが一見してわかる。しかし、両者は全く同じではなく、その差が[[有意]]かどうかは表内の各エントリが母集団からの無作為抽出であるとして、[[帰無仮説]]について[[カイ二乗検定]]、[[G検定]]、[[フィッシャーの正確確率検定]]といった[[仮説検定]]を行うことで確かめることができる。表の各行や各列について割合が異なる場合、その表は2つの変数間の「付随性」(contingency) を示していると見ることができる。付随性がない場合、2つの変数は「独立」(independent) と見ることができる。''contingency table'' という用語は、[[カール・ピアソン]]が "On the Theory of Contingency and its Relation to Association and Normal Correlation"(in ''[[:en:Drapers' Company|Drapers' Company]] Research Memoirs (1904) Biometric Series I'')で使ったのが初出とされている。
 
上の例は最も単純な形式の分割表であり、各変数は2つの値しかとらない。これを2×2分割表と呼ぶ。行や列は任意の個数のものがありうる。2つより多くの変数についての分割表もありうるが、その場合れら紙上で表現するのが難しい。[[尺度水準#順序尺度|順序尺度]]についても ''r''&times;''s'' 分割表で表すこができ呼ばれが、順序尺度についての分布は[[中央値]]で実質的に代表させることができるため、分割表の利用は名義尺度ほど一般的ではない
{| class="wikitable" style="text-align:center; margin:0 auto"
|+ ''r''&times;''s'' 分割表
! !! ''B''<sub>1</sub> !! ''B''<sub>2</sub> !! &hellip; !! ''B''<sub>''s''</sub> !! 計
|-
! ''A''<sub>1</sub>
| ''N''<sub>11</sub> || ''N''<sub>12</sub> || &hellip; || ''N''<sub>1''s''</sub> || ''N''<sub>1&bull;</sub>
|-
! ''A''<sub>2</sub>
| ''N''<sub>21</sub> || ''N''<sub>22</sub> || &hellip; || ''N''<sub>2''s''</sub> || ''N''<sub>2&bull;</sub>
|-
! &#8942;
| &#8942; || &#8942; || &#8945; || &#8942; || &#8942;
|-
! ''A''<sub>''r''</sub>
| ''N''<sub>''r''1</sub> || ''N''<sub>''r''2</sub> || &hellip; || ''N''<sub>''rs''</sub> || ''N''<sub>''r''&bull;</sub>
|-
! 計
| ''N''<sub>&bull;1</sub> || ''N''<sub>&bull;2</sub> || &hellip; || ''N''<sub>&bull;''s''</sub> || ''N''
|}
2つより多くの変数についての ''m''<sub>1</sub>&times;''m''<sub>2</sub>&times;&hellip;&times;''m''<sub>''k''</sub> 分割表(''k'' 重分割表)もありうるが、その場合は紙上で表現するのが難しい。[[尺度水準#順序尺度|順序尺度]]についても分割表で表すことができるが、順序尺度についての分布は[[中央値]]で実質的に代表させることができるため、分割表の利用は名義尺度ほど一般的ではない。
 
== 関連性の尺度 ==
2つの変数の関連性の度合いは、いくつかの係数で評価できる。最も単純な係数として以下のように定義される[[ファイ係数]]がある。
 
35 ⟶ 57行目:
 
''C'' は、行と列が任意個の表であっても <math>\sqrt{\frac{k-1}{k}}</math> で割ることで完全な相関があるときに最大値が1になるようにできる。
 
''contingency table'' という用語は、[[カール・ピアソン]]が "On the Theory of Contingency and its Relation to Association and Normal Correlation"(in ''[[:en:Drapers' Company|Drapers' Company]] Research Memoirs (1904) Biometric Series I'')で使ったのが初出とされている。
 
==外部リンク==