関連表(分割表)
処理と製表をする前のデータは通常、生データ 1ないし未加工データ 1と呼ばれ、処理と製表をした後のデータは基礎データ 1ないし第一次データ 1と呼ばれる。基礎データは通常、統計表 4の形でまとめられた絶対値 3の系列 2からなる。このような表のデータは通常、年齢や子供数といった特定の変数 5ないし変量 5に関して分類されたり、特定の属性 6ないし特性 6(すなわち性、配偶関係等)に関して分類されたりする。データがいくつかの変数ないし属性に関して同時に分類されるような表は、クロス集計表 7ないし関連表(分割表) 7と呼ばれる。要約表 8は個別表 9ほど詳細でない情報をもたらす。
- 1. データが分析単位としての個人(110-2)に関するものである場合、それはミクロ・データmicro-dataと呼ばれる。集計データaggregate dataないしマクロ・データmacro-dataは、たとえば国家や一国内の行政単位といった個人以外の分析単位に関するものである。ミクロ・データは実地調査(203-5)や人口動態登録簿の標本から得られる。ミクロ・データの新たな利用源としてセンサス公共利用標本census public use sampleがあるが、これは関心をもつユーザーの分析目的のために供せられるセンサスの個票から、系統抽出ないし無作為抽出した標本である。
- 7. 母集団内における単一の変数ないし属性の分布を示す表は、一般的に度数表frequency tableと呼ばれる。
分割表
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2019/12/02 00:28 UTC 版)
ナビゲーションに移動 検索に移動この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。 出典を追加して記事の信頼性向上にご協力ください。(2016年3月) |
分割表(英: contingency table)は、統計学または日本工業規格において、2つ以上の変数(名義尺度が一般的)の間の関係を記録し分析するためのもの[1]。
概要
例えば、性別(男性と女性)と利き手(右手と左手)という2つの変数があるとする。100人の無作為抽出した標本について、これら変数を観測する。すると、2つの変数の関係は次のように分割表で表すことができる。
右利き | 左利き | 計 | |
---|---|---|---|
男性 | 43 | 9 | 52 |
女性 | 44 | 4 | 48 |
計 | 87 | 13 | 100 |
この表で、右端の列を行周辺合計 (row marginal total) 、下端の行を列周辺合計 (column marginal total) と呼び、右下端の角にあたる部分を総計 (grand total) と呼ぶ。
この表から、男性の右利きの割合と女性の右利きの割合には大差がないことが一見してわかる。しかし、両者は全く同じではなく、その差が有意かどうかは表内の各エントリが母集団からの無作為抽出であるとして、帰無仮説についてカイ二乗検定、G検定、フィッシャーの正確確率検定といった仮説検定を行うことで確かめることができる。表の各行や各列について割合が異なる場合、その表は2つの変数間の「付随性」(contingency) を示していると見ることができる。付随性がない場合、2つの変数は「独立」(independent) と見ることができる。contingency table という用語は、カール・ピアソンが "On the Theory of Contingency and its Relation to Association and Normal Correlation"(in Drapers' Company Research Memoirs (1904) Biometric Series I)で使ったのが初出とされている。
上の例は最も単純な形式の分割表であり、各変数は2つの値しかとらない。これを2×2分割表と呼ぶ。行や列は任意の個数のものがあり、それらは r×s 分割表と呼ばれる。
B1 | B2 | … | Bs | 計 | |
---|---|---|---|---|---|
A1 | N11 | N12 | … | N1s | N1• |
A2 | N21 | N22 | … | N2s | N2• |
⋮ | ⋮ | ⋮ | ⋱ | ⋮ | ⋮ |
Ar | Nr1 | Nr2 | … | Nrs | Nr• |
計 | N•1 | N•2 | … | N•s | N |
2つより多くの変数についての m1×m2×…×mk 分割表(k 重分割表)もありうるが、その場合は紙上で表現するのが難しい。順序尺度についても分割表で表すことができるが、順序尺度についての分布は中央値で実質的に代表させることができるため、分割表の利用は名義尺度ほど一般的ではない。
関連性の尺度
2つの変数の関連性の度合いは、いくつかの係数で評価できる。最も単純な係数として以下のように定義されるファイ係数がある。
ここで、χ2 はピアソンのカイ二乗検定で得られる値、N は観測の総計である。φは0(変数間には全く関係がない)から1(変数間には完全な関係がある)までの値をとる。この係数は2×2分割表でのみ使える。他にも、テトラコリック相関係数(これも2×2分割表でのみ利用可能)、C係数 (contingency coefficient)、クラメールのV係数などがある。C係数は、非対称な表(行数と列数が同じでない表)では完全な相関であっても最大値が1にならないという欠点がある。テトラコリック相関係数は2つの変数が正規分布の場合のピアソンの確率相関係数であり、確率変数の分布を適切な割合で2つのカテゴリに分類することで、観測された分割表を再現することができる。セルに 0 と 1 という値を割り当てて計算されるピアソンの確率相関係数と混同すべきではない。各変数が3つ以上の値をとる場合の表についての同様の量を多分相関係数と呼ぶ。
他の係数は次のような式で表される。
k は列数または行数の少ないほうである。
C は、行と列が任意個の表であっても で割ることで完全な相関があるときに最大値が1になるようにできる。
脚注
- ^ JIS Z 8101-1 : 1999, 2.10 分割表.
参考文献
- 西岡康夫『数学チュートリアル やさしく語る 確率統計』オーム社、2013年。ISBN 9784274214073。
- 日本数学会『数学辞典』岩波書店、2007年。ISBN 9784000803090。
- JIS Z 8101-1:1999 統計 − 用語と記号 − 第1部:確率及び一般統計用語, 日本規格協会, (1999)
関連項目
外部リンク
- On-line analysis of contingency tables: calculator with examples
- Fisher and chi-square calculator of 2 × 2 contingency table
|
分割表
出典: フリー百科事典『ウィキペディア(Wikipedia)』 (2021/10/05 08:23 UTC 版)
n {\displaystyle n} 個の要素からなる集合 S {\displaystyle S} に対し、2つのグループ化または分割(クラスタリングなど) X = { X 1 , X 2 , … , X r } {\displaystyle X=\{X_{1},X_{2},\ldots ,X_{r}\}} と Y = { Y 1 , Y 2 , … , Y s } {\displaystyle Y=\{Y_{1},Y_{2},\ldots ,Y_{s}\}} を考える。 X {\displaystyle X} と Y {\displaystyle Y} の重なりは、次のような分割表 [ n i j ] {\displaystyle \left[n_{ij}\right]} にまとめることができる。ここで、 n i j {\displaystyle n_{ij}} のそれぞれは、 X i {\displaystyle X_{i}} と Y j {\displaystyle Y_{j}} が共有するオブジェクトの数を表す 。すなわち、 n i j = | X i ∩ Y j | {\displaystyle n_{ij}=|X_{i}\cap Y_{j}|} 。 X ╲ Y Y 1 Y 2 ⋯ Y s sums X 1 n 11 n 12 ⋯ n 1 s a 1 X 2 n 21 n 22 ⋯ n 2 s a 2 ⋮ ⋮ ⋮ ⋱ ⋮ ⋮ X r n r 1 n r 2 ⋯ n r s a r sums b 1 b 2 ⋯ b s {\displaystyle {\begin{array}{c|cccc|c}{{} \atop X}\!\diagdown \!^{Y}&Y_{1}&Y_{2}&\cdots &Y_{s}&{\text{sums}}\\\hline X_{1}&n_{11}&n_{12}&\cdots &n_{1s}&a_{1}\\X_{2}&n_{21}&n_{22}&\cdots &n_{2s}&a_{2}\\\vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\X_{r}&n_{r1}&n_{r2}&\cdots &n_{rs}&a_{r}\\\hline {\text{sums}}&b_{1}&b_{2}&\cdots &b_{s}&\end{array}}}
※この「分割表」の解説は、「ランド指数」の解説の一部です。
「分割表」を含む「ランド指数」の記事については、「ランド指数」の概要を参照ください。
- 分割表のページへのリンク