臨床と統計をつなぐブログ

理学療法士・作業療法士・言語聴覚士・看護師のみなさんをサポートしたい

カテゴリカルデータとカイ二乗検定

カテゴリカルデータの分析において、クロス集計表とχ²(かいじじょう)検定はよく使用されています。しかし、χ²検定がなぜ有効なのか、どのように計算されるのかをしっかり理解して使用している人は少ないように思います。

今回は、「仮説の設定」から「期待度数の算出」、そして「統計量 (X2X^2) の解釈」まで、順を追って解説します。

1. 仮説の設定

最初に、𝑋²検定で確認したい仮説を設定します。今回のテーマは、「バランス検査と転倒リスクの関係性があるかどうか」です。

帰無仮説 (H0H_0)

「バランス検査の結果と転倒リスクは無関係である」(つまり、2つの変数に関連性はない)

対立仮説 (H1H_1)

「バランス検査の結果と転倒リスクには関係がある」(つまり、関連性がある)

2. 期待度数の算出

次に、観測データを基に、期待度数を計算します。期待度数とは、帰無仮説が正しい場合に観測されると予測される度数のことです。

観測データ

以下は、バランス検査の結果と転倒リスクを基にしたクロス集計表です:

  転倒リスク 高 転倒リスク 低 合計
バランス検査陽性 160 80 240
バランス検査陰性 40 720 760
合計 200 800 1000

期待度数の計算方法

期待度数は次の公式で計算されます:

期待度数=行合計×列合計総合計期待度数 = rac{ ext{行合計} imes ext{列合計}}{ ext{総合計}}

例えば、「転倒リスク 高」かつ「バランス検査陽性」のセルの期待度数は:

期待度数=200×2401000=48期待度数 = rac{200 imes 240}{1000} = 48

期待度数を計算した表は以下の通りです:

 

転倒リスク高 (期待度数)

転倒リスク低 (期待度数) 合計
バランス検査陽性 160 (48) 80 (192) 240
バランス検査陰性 40 (152) 720 (568) 760
合計 200 800 1000

3. 統計量 (X2X^2) の計算と意味

カイ二乗統計量 (X2X^2) は、観測度数と期待度数の差を基に計算されます。計算式は次の通りです:

χ2=∑(観測度数−期待度数)2期待度数chi^2 = sum rac{(観測度数 - 期待度数)^2}{期待度数}

例えば、「転倒リスク高」かつ「バランス検査陽性」のセルの貢献度は:

(160−48)248=112.33rac{(160 - 48)^2}{48} = 112.33

同様に各セルの貢献度を計算し、すべてを合計すると次のようになります:

X2=481.81X^2 = 481.81

4. 分布表と統計量の解釈

カイ二乗統計量 (X2X^2) は、カイ二乗分布に従います。この分布は、自由度 (dfdf) によって形が変わります。

自由度 (dfdf) の計算

自由度は以下の式で求められます:

df=(行の数−1)×(列の数−1)df = ( ext{行の数} - 1) imes ( ext{列の数} - 1)

今回の例では:

df=(2−1)×(2−1)=1df = (2 - 1) imes (2 - 1) = 1

カイ二乗分布での位置確認

次に、カイ二乗統計量が分布上どこに位置するのかを確認します。

# Rコード:カイ二乗分布の可視化
curve(dchisq(x, df = 1), from = 0, to = 500, xlab = "カイ二乗統計量 (X^2)", 
      ylab = "確率密度", main = "自由度1のカイ自乗分布")
abline(v = 481.81, col = "red", lwd = 2, lty = 2)  # 統計量の位置を赤線で表示

結果の図を以下に示します:

  • 赤線はカイ二乗統計量 X2=481.81X^2 = 481.81 を表します。
  • 分布の右端に位置しており、有意水準 0.05 の臨界値より大きいため、帰無仮説は棄却されます。

有意性の結論

帰無仮説「バランス検査と転倒リスクは無関係である」は棄却され、2つの変数には有意な関係があると結論付けられます。

まとめ

今回の記事では、カイ二乗統計量の算出プロセスを詳しく説明しました。特に、「仮説の設定」「期待度数の計算」「統計量の解釈」という流れを意識することで、データの意味を深く理解できるようになります。

次回は、カイ二乗検定の適用条件が満たされない場合に便利な「フィッシャーの正確確率検定」について解説します!

統計解析の基礎:カテゴリカルデータとクロス集計

クロス集計表という言葉を聞いたことはありますか?

カテゴリカルデータをまとめる際、「クロス集計表」は基本的かつ重要なツールとなります。医療やリハビリの現場、またアンケート集計などにも使用され、患者さんの特徴を把握する際にもよく使われます。

カテゴリカルデータとは?

カテゴリカルデータは、対象を「カテゴリー」に分類するデータのことです。

以下のような分類があります:

  • 名義尺度:カテゴリーに順位がない(例:性別、血液型、性別、疾患の有無)
  • 順序尺度:カテゴリー間に順位がある(例:リスクが低・中・高)

今回扱う「バランス検査陽性・陰性」や「転倒リスク 高・低」は順位がないので、名義尺度に分類されます。

バランス検査の結果と転倒リスクの関係

以下は、バランス検査の結果と転倒リスクの関係を調べたデータをクロス集計表にまとめたものです。

クロス集計表

  転倒リスク 高 転倒リスク 低 合計
バランス検査(陽性) 160 80 240
バランス検査(陰性) 40 720 760
合計 200 800 1000

 

この表から、バランス検査(陽性)の人は約66.7%(160/240)が転倒リスクが高く、一方、バランス検査(陰性)の人は約94.7%(720/760)が転倒リスクが低いことがわかります。

Rコードでクロス集計表を作成

以下は、Rでクロス集計表を作成するコードです

 

# データの作成
data <- matrix(c(160, 80, 40, 720), nrow = 2, byrow = TRUE)
rownames(data) <- c("バランス検査陽性", "バランス検査陰性")
colnames(data) <- c("転倒リスク 高", "転倒リスク 低")
data <- as.table(data)

# クロス集計表の表示
data

クロス集計表の活用

クロス集計表は、以下のような目的で活用されます:

  1. 傾向の把握
    転倒リスクとバランス検査結果の関係を視覚的に確認できます。例えば、転倒リスクの割合が検査結果に応じて大きく異なることがわかります。

  2. 仮説の検証
    これらの関係が偶然か否かを統計的に検証するには、χ2\chi^2検定などの手法が必要です。

結論

クロス集計表はカテゴリカルデータを視覚的に整理し、データの傾向や特徴を理解するのに便利な手法です。バランス検査結果が転倒リスクと関係している可能性が示唆されました。

次回は、この関係が統計的に有意であるかをχ2\chi^2検定を使って確認します!データ解析の第一歩として、クロス集計表を是非活用してみましょう!

統計解析の基礎:ウィルコクソン符号付順位検定の活用

今回は、あるグループが1カ月間ウォーキングを続けた前後の体重データを例に、ウィルコクソン符号付順位検定というノンパラメトリック検定を使って解析する方法をご紹介します!

ウィルコクソン符号付順位検定とは?

これは、対応のある2群の量的データ(例えば同じ人の介入前後の測定値)を比較するための検定です。
特徴

  1. データが正規分布に従っていない場合に有効
  2. 数値がその順位に基づいて評価される

この検定は、t検定(対応のあるt検定)と似た状況で使えますが、データの仮定が厳しくないためより柔軟な手法です。

対応のある?ない?の違い、仮定条件については、過去のブログをご参照ください!

statfit-lab.hatenablog.com

データ例:ウォーキング前後の体重変化

ウォーキングを1カ月間続けた10人の体重データを以下のように集めました。

被験者 介入前(kg) 介入後(kg)
A 70.1 69.5
B 68.4 67.8
C 82.3 81.9
D 74.6 74.6
E 65.9 65.4
F 80.2 79.1
G 72.7 72.2
H 67.5 67.3
I 69.8 69.2
J 76.4 76.1

ウィルコクソン符号付順位検定の流れ

1.差を計算する

介入後から介入前を引き算します。

被験者 差(kg)
A -0.6
B -0.6
C -0.4
D 0.0
E -0.5
F -1.1
G -0.5
H -0.2
I -0.6
J -0.3

 

2.差の絶対値を順位付け
次に、差の絶対値に基づいて順位を付けます。同じ値には平均順位を割り当てます。

被験者 差(kg) 絶対値 符号付き順位
A -0.6 0.6 - 8
B -0.6 0.6 - 8
C -0.4 0.4 - 5
D 0.0 0.0 0
E -0.5 0.5 - 5.5
F -1.1 1.1 - 10
G -0.5 0.5 - 5.5
H -0.2 0.2 - 2
I -0.6 0.6 - 8
J -0.3 0.3 - 4

 

3.符号に基づいて順位を分ける
差が負の場合は「負の順位合計」、正の場合は「正の順位合計」として集計します。

  • 負の順位合計: 8 + 8 + 5 + 5.5 + 10 + 5.5 + 2 + 8 + 4 = 56
  • 正の順位合計: 0 = 0

4.検定統計量を計算して判定
ウィルコクソン符号付き順位検定は、正負の大きい方の順位合計を検定統計量として採用し、片方に偏りすぎているかを検定します。このデータでは、負の順位合計が非常に大きいため、ウォーキングで有意な体重減少があると判断される可能性があります。

結果の解釈

結果として、ウォーキングは体重減少に有意な効果があった! という結論が得られるかもしれません。しかし、解釈には注意が必要で、特にサンプルサイズが小さい場合、偶然による結果である可能性も否定できません。

ウィルコクソン符号付順位検定を使う際の仮定

  1. データは対応のあるペア(同じ被験者の前後)であること
  2. 測定値は連続尺度または順序尺度であること
  3. 分布の形に仮定は不要だが、差が対称的であることが望ましい

* インスタで紹介しているショート動画も公開ました!

www.youtube.com

 

最後に

ウィルコクソン符号付順位検定は、データが正規分布に従わない場合でも信頼できる検定方法です。ぜひ実務で活用してみてください!

ウィルコクソン順位和検定を使いこなそう!

あけまして、おめでとうございます。本年も、本ブログをよろしくお願いします!

今年は、「テーマ」に沿ったまとめ記事だけでなく、研究・統計コンサルティングでのあるある話や、Rコードに特化したブログ記事も展開していこうと思います!では、早速ですが、ウィルコクソン順位和検定についてまとめたので、紹介させて頂きます。

はじめに

ノンパラメトリック検定として有名なウィルコクソン順位和検定(Wilcoxon rank-sum test)は、対応のない2群間の比較に使える便利な手法です。

この検定は、データが正規分布に従わない場合に有効です。

今回は、この検定がどんな場合に使えるのか、またその仮定条件について解説します。

ウィルコクソン順位和検定とは?

ウィルコクソン順位和検定は、2つの独立した群の分布の差を比較するためのノンパラメトリック検定です。スチューデントのt検定(対応のない検定)が正規分布を仮定するのに対し、この検定では特定の分布を仮定せず、データの「順位」に基づいて計算を行います。

これにより、正規性が満たされない場合でも使いやすいのが特徴です。

具体例

例えば、リハビリの研究で「サルコペニアがある人」と「サルコペニアがない人」の歩行速度の違いを調べるとします。

データが正規分布を満たしていなければ、t検定の代わりにウィルコクソン順位和検定を適用することができます。

検定の仮定条件

ノンパラメトリック検定であっても、以下の仮定条件を理解しておくことが大切です!

  1. 独立性
    各群のデータは互いに独立している必要があります。たとえば、同じ患者が両群に含まれている場合、この検定は適用できません

  2. 尺度
    データが少なくとも順序尺度(大小関係がある)であることが必要です。例えば、歩行速度のように「速い・遅い」が順位づけできるデータは適していますが、カテゴリデータ(例えば「好き・嫌い」など)には使えません

  3. 分布形状の同一性
    両群の分布の形状が大きく異なる場合、この検定で得られる結果の解釈が難しくなることがあります

検定の進め方

  1. データの順位付け
    両群のデータを統合し、小さい値から順位を付けます。

  2. 順位の合計を計算
    各群の順位の合計を算出します。

  3. 検定統計量を計算
    順位の合計から検定統計量を導出します。

  4. p値の算出
    検定統計量をもとに、検定の有意性を評価します。

例:Rでの解析

次のデータを使って解析をしてみましょう:

# データ準備
sarcopenia <- c(0.8, 1.0, 1.2, 1.1, 0.9) # サルコペニアあり
no_sarcopenia <- c(1.5, 1.7, 1.6, 1.8, 1.4) # サルコペニアなし

# ウィルコクソン順位和検定
test_result <- wilcox.test(sarcopenia, no_sarcopenia, alternative = "two.sided")

# 結果の表示
print(test_result)

結果の解釈

  • W は検定統計量
  • p値 が有意水準(通常0.05)以下であれば、2群の歩行速度に有意差があると判断します

次回予告

次回は、対応があるデータの解析に使えるウィルコクソン符号付順位検定について詳しく解説します。

仮説検定には仮定がある!ノンパラメトリック検定を知る第一歩

統計解析の中核を担う「仮説検定」。その結果を解釈するには、背後にある「仮定」の重要性を理解することが欠かせません。しかし、現実のデータは必ずしもその仮定を満たすわけではありません。

そんなとき、頼れる手法が「ノンパラメトリック検定」です。今回は、仮説検定に伴う仮定と、それが満たされない場合の対処法を解説します。

仮説検定における基本的な仮定

仮説検定の背後には、次のような仮定が設定されています:

  1. 正規分布
    データが正規分布に従っていることが前提とされる場合が多いです。例えば、スチューデントのt検定では、各群の母集団が正規分布であることを仮定します。

  2. 独立性
    観測値が互いに独立している必要があります。たとえば、同一被験者から繰り返し測定されたデータでは、この仮定が成り立たない場合があります。

  3. 等分散性
    各群の分散が等しいことが求められることがあります(例:スチューデントのt検定)。

これらの仮定が満たされているかどうかを確認せずに検定を行うと、結果が信頼できない可能性があります。

statfit-lab.hatenablog.com

statfit-lab.hatenablog.com

仮定が満たされない場合の問題

仮定が成り立たないデータに対してそのまま検定を行うと、第1種過誤や第2種過誤が増加するリスクがあります。例えば、正規分布から大きく外れたデータに対してt検定を適用すると、誤った結論を導く可能性が高まります。

論文(Rosner et al., 2016)でも、仮定が成り立たない状況での統計手法の選択の重要性が指摘されています。現実世界では、データが非正規分布を示すことが多く、特に少人数のサンプルでは正規性を満たすことが難しいケースが頻繁にあります。

ノンパラメトリック検定の登場

こうした問題を解決するために使えるのが「ノンパラメトリック検定」です。この手法は、正規分布などの特定の分布を仮定しないため、柔軟性があります。次回以降、以下のような具体的な検定を紹介します:

  • ウィルコクソンの符号順位検定
    対応のあるデータの検定に利用されます。例えば、リハビリ前後の患者の歩数変化を評価する場合

  • マン・ホイットニーのU検定
    対応のない2群間の比較に使われます。サルコペニアの有無による歩行速度の違いを調べる場合

実務に生かすための第一歩

次回の記事では、ウィルコクソン検定とマン・ホイットニーU検定について解説します。仮定を気にせずに使える手法ですが、その特性や限界も理解しておくことが重要です。

最後に一つのポイント:

統計解析を行う前に、まずデータの分布を確認し、仮定が成り立っているかを検討することを忘れないでください!