2024-12-22

悲報ブクマカまたしても統計無知さら

この記事へのブクマカの反応見て笑った。

「1日どれくらい歩くと“うつ病”になりにくいのか。1000歩増でも効果あり?9万人以上対象調査研究紹介】」

https://levtech.jp/media/article/column/detail_582/

はてブコメント

https://b.hatena.ne.jp/entry/s/levtech.jp/media/article/column/detail_582/

記事過去研究から一日の歩数とうつ症状の関係メタ分析している研究の紹介な。そこにこういうコメントがついている。(idは書かないでおく)

バカじゃねえの。「鬱でないから歩く」を排除できてないじゃねえか。/十分にコントロールされてない、相関でしかないと原文にも書いてある。文系バカなんだから何か意見持ったダメだよ。

これ、有意差はあるのかもしれないが擬似相関の可能性は捨てられないことを隠してるよね。歩くことがうつ病効果があるのか検証するなら任意抽出した一定被験者ランダムに歩数を指定した生活させないと。


俺は恥ずかしいと思ったね。はてブの民の統計リテラシーの低さに。こんなに強い言葉無知を晒せるものなのかね。

かにさ、統計関係因果関係を含意しないってのを理解してる人が増えてきたのはいいことだと思う。そこはわかってて偉いよ。いかがでしたかブログなんかで相関関係だけから「だから歩くことはうつ病の予防に効果があります」とか言ってたら、ちゃんとこれからツッコミしていこうな。

でも、お前らにはここからもう一歩踏み込んで、因果推論ってのがどういうもんかを知ってもらいたいわけ。相関と因果の違いを指摘するだけなら今や誰でもできるが、「じゃあどうやって因果推定するんだ?」という話になると、ちゃんとした研究デザインとか統計の考え方を知ってないと理解できなくなる。だからこの機会に因果推論研究の基本をかいつまんで話してやろうと思う。

まず、観察研究と介入研究の違いをおさえてほしい。

因果関係をはっきりさせたけりゃ、介入実験をするのが基本なんだわ。そういうのをランダム比較試験(Randomized Controlled Trial: RCT)って呼ぶんだけど、要するに被験者無作為に2つ以上のグループに割り振って、一方にはある介入を行い、もう一方には行わない。そうすることで、余計な条件(交絡因子)を平均化して「この介入があるかないかアウトカムがどう変わるか」を調べられるってわけだな。医薬品臨床試験でよくやるやつだ。

RCTは因果推論の王道とされてる。被験者の割り振りをランダムにすることで、たとえば年齢とか、生活習慣とか、知られてない要因まで含めて、できるだけ統一感をもたせるんだ。だから「結果に影響を与える別の要因」が両グループ間で偏らない可能性が高くなるわけ。もちろん完全に不可能ってことはないんだが、それでも観察研究と比べればはるか因果関係推定やすい。だからみんな「RCT最強」とか言うんだろうな。

でも、お前らも想像つくと思うけど、RCTってのはいつでも簡単にできるわけじゃない。特に今回の「歩数を増やすと本当にうつが減るのか?」って話でRCTを組もうとしたら、「はいあなた毎日7,000歩以上歩いてください」「あなたは1日5,000歩未満にしてください」なんて割り振らなきゃいけない。しかし実生活でそこまで厳密に歩数をコントロールさせるのは難しいし、長期的に続けるのも金がかかるし道義的問題も出てくる。それをクリアしても、大規模研究モニタリングには莫大なコストがかかる。医薬品のRCTみたいに販売で元が取れる見通しがあれば企業が金出すかもしれんが、歩数の研究でそこまでのメリットがあるかっていうと怪しいよな。

からといって介入ができなければ相関関係以上のことは何もわからないわけじゃなくて、多くの場合は観察研究を使うのさ。今回の論文も、横断研究や前向きコホート研究だって記事に書いてあったろ?観察研究ってのは、研究者が「歩数を多くしてくれ」とか介入を指示するわけじゃなくて、観察されたデータを集めるものだ。だからこそ、横断研究だと「うつから歩かないのでは?」って方向の因果関係があり得るし、コホート研究だってそれを完全に排除できるかは微妙。もちろん、データ収集時の工夫や統計手法でそれをなるべく除去しようとはするんだけど、RCTほどにははっきりしないわけだ。

前向きコホート研究は一応、時間前後関係コントロールする形になる。「はじめに健康状態生活習慣を測定→一定期間後にうつ病発症たかどうかを追う」みたいな流れを作れば、「うつ病になったから歩かない」という逆向き因果可能性をある程度は小さくできる。それに基づいて「毎日7000歩以上歩く人はうつ発症リスク31%低い」とか「1000歩増えるごとにリスクが9%下がる」とか、そんな結論を導くわけだ。だだし、これは因果関係表現した言葉遣いではないことに注意な。そこから「歩数が増えればうつを予防できる」という結論は導けない。観察研究からな。未知の要因が絡んでるかもしれないし、統計モデルで調整したって全部はカバーできないのが現実だ。

でも、それは別に研究者がバカからわかってない」とか「都合の悪い情報を隠してる」って話じゃないんだよ。研究者サイドからすれば、観察研究で分かることと分からないことの限界なんて、常識のようにわかってるんだ。元の論文を実は読んでいないが、きっと留意事項はいろいろ書いてあるはずだ。メタ分析だしな。

結局のところ、RCTですら完全に「因果関係証明」っていう言い方はしないもんだ。試験デザインに欠陥があったり、サンプル数が少なかったり、無作為化がちゃん機能しなかったり、いくらでもケチをつけようと思えばつけられる。あくまで「因果関係可能性が非常に高い」とか「かなり信頼度が高い」ぐらいに言うのが科学的な態度。だから観察研究で「うつになりにくそう」という結果が出たとしても、研究者は「まあ妥当そうだけどコントロールに仕方に問題があり、さらなる前向き研究必要」と言うし、これまた自然な話なんだ。

ここで、「横断研究なんて相関関係しかからいから無価値だろ」みたいな意見があるかもしれないが、それも単純すぎる見方だ。横断研究で「歩数が多い人ほど抑うつが少ない」という相関関係確認できたら、それだけでも儲けもんだ。仮説として「歩くことが抑うつの予防に何らかの効果があるかもしれない」という種ができるんだよ。さらに前向きコホートやRCTで検証していこうって流れになるわけだから無駄にはならない。それが科学の積み上げってやつだろ?

で、今回の記事を読んで「歩数1,000歩増えるごとにリスク9%低下か、じゃあ試しにちょっと歩いてみようかな」と思うかどうかは、お前ら自身意思決定次第なんだよな。統計データってのは、意思決定のための判断材料であって、「絶対的証明された結論」ってわけじゃない。いいか統計証明の道具じゃなくて、不確実性の中でどう行動するかを助けてくれる実用的な道具なんだ。そこを勘違いすると「いや、完全には証明されてないか意味ない」とか言い出して何も始まらないことになる。

現に、医療現場でも「絶対副作用がない」とは良心のあるやつなら誰も断言しないし、「この薬は100%効きます」なんて宣言するわけでもない。常に効果リスクを天秤にかけつつ、「確からしさ」に賭けて使ってるわけさ。歩くことに関していえば、仮に「実は因果関係がそこまで強くないかもしれない」って可能性があったとしても、デメリットはそんなにないし、健康上のメリットはいろいろ言われてる。だったら「やってみたら?」ってレベルの話だろう。自分自身健康責任を持つための選択肢としては悪くない。

まあまとめるとだな、「相関=因果ではない」ってお前らが得意げに言うのはとても偉いと思うけど、因果推論はすべて可能性の程度の問題グラデーションがあるってことと、観察研究でも一定程度の因果可能性を確認できるってことも知っておいてくれ。以上、お前らにオレ様からの有難い講釈でした。ちょっとは歩いてこいよ。

  • わざわざ長文で増田に投稿してるってのが、なんかご自身のブログが過疎ってそうでかわいそうになるんだよね

  • 元ネタたどってないけど「皇居ほど空気が綺麗じゃない都内で散歩しまくったら騒音由来の突発性難聴と排ガス由来のCOPDになりました」でおわりだとおもうぞ 未だにマフラーからくっさ...

  • 原文を読まずに、教科書的な基本知識を書き散らかして何が楽しいんだ?   今回のメタアナリシスの論文の結論は、相関があるけれども、ちゃんと因果関係があるかを確認するためにコ...

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん