「ダメな科学」を見分けるための大まかな指針」のポスター解説(3)「相関関係と因果関係の混同」

4. 相関関係と因果関係の混同(難易度☆☆☆)

相関関係と因果関係を混同しないように注意しましょう。「二つの変数に相関関係がある」ことは、必ずしも「一方が他方の原因である」ことを示しません。地球温暖化は1800年代から進行しており、同時に海賊の数も減少していますが、海賊不足は地球温暖化の原因ではありません。

対処法の例:「○○が増えると××が増えた→○○は××の原因だ」の間に、なにか共通の背景があったり、統計を取る集団に偏りがあるなどの「ウラ」がないか、ということに注意する

  • 「××が増えたせいで、○○(がん・アトピー・不妊症・自閉症etc)が増えている」
  • 「△△をよく食べる地域は寿命が長い。よって、△△は寿命を伸ばす(健康にいい)」

こういった情報を見たことがあると思います。今回のテーマは、相関関係があるように見える「ある原因」と「その結果」に、本当に原因/結果の関係がある(因果関係がある)のか?という話です。



「相関と因果」

「相関がある」というのは、ごく簡単に言うと「数Aが増える(減る)と、それに伴って数Bも増える(減る)」という関係にあることです。一方、「因果関係がある」というのは、「一方の増加(減少)が他方の増加(減少)の原因となっている」ことを指します。

この2つは、目に見える現象としては同じで、「一方が増える(減る)のと、他方が増える(減る)のが連動している」になります。しかし、「相関関係にある」からと言って、「因果関係がある」とは限りません。他に共通する要因があるとか、偶然そうなっていることがあるからです。

国立環境研究所環境リスク研究センターで化学物質のリスク評価の研究をされている林氏のブログで、「因果関係がないのに相関関係があらわれるケース」を紹介しています。本記事では、(1)偶然(2)因果の流れが逆(3)因果の上流側に共通の要因が存在する(4)因果の合流点において選抜/層別/調整されてしまっている、の4つのケースについて、わかりやすく解説されています。

また、以下の記事でも身近な例を挙げて相関と因果の違いについて解説されています。

 


「相関」と「因果」を知るための研究

さて、ここまででこの項目はだいたい終わりなのですが、もう少し詳しく知りたい方のために、一冊の本を紹介しておきます。

基礎から学ぶ楽しい疫学

基礎から学ぶ楽しい疫学

複数のできごとの相関関係や因果関係を知ることは、医学を含む科学研究の重要ないとなみの一つです。ヒトの健康については、実験で分かることは限られている(人体実験できない)ため、「集団の健康状態の分布を観察」することによって、健康に影響するいろいろな要因を調べています。このような学問を「疫学」といいます。例えば、喫煙者と非喫煙者の肺がん発生率を比べる、がん検診による死亡率の減少を調べる、薬の効果を調べる、などが疫学の研究対象になります。

疫学の歴史は、1850年代のイギリス(ロンドン)におけるこれらの流行をもって始まるといわれている。本来は麻酔科医であったジョン・スノウはコレラ患者の居住地を地図上にプロットしていき、患者が特定の井戸の周囲に集中していることを発見した(図1-1)。このことよりコレラはこの井戸水によって発生しているとして、この井戸を封鎖したところ、患者が減少した。また、表1-1に示すようにロンドンの2つの水道会社の供給人口と患者発生頻度を比較し、特定の会社の水が危険であることも指摘した。たお、この当時は水道会社といってもテムズ川から取水してそのまま(消毒もせずに)配水していただけであり、Lambeth社の取水口は市街地よりも上流に、Southwark社の取水口は下流にあったにすぎない。そして、し尿も当然のことながら、なんら処理もされずにテムズ川へ流されていた。

  • 「基礎から学ぶ 楽しい疫学」 第二版 p2-4, 中村好一, 医学書院

この例では、「コレラ菌」という、病気の真の原因(病原菌)はまだ発見されてなかったにもかかわらず、「井戸」や「水道」と病気の発生率や死亡率の関係を調べることで、感染予防に役立てることができました。原因がわからなくても病気の予防が可能になるのは疫学の大きな強みですが、実は疫学研究で病気の原因を確定することはけっこう難しいのです。それは、「関連があること」と「因果関係にあること」が必ずしもイコールではないからです。

相関関係を調べるときは、調査をするときに生じる偏り(バイアス)にも注意が必要です。例えば、「副作用が心配されているある薬を飲んだ人と飲まない人の来院率」という調査を行ったとします。薬を飲んだ人は副作用が心配なので、ちょっとした体調の変化でも病院に行く人が増えるでしょう。そうすると、服薬した人で来院率が高くなります。この調査結果から「その薬を飲んだ人は体調を崩しやすくなる」と結論するのは適切ではないでしょう。

「病気の原因になりそうなことと病気の発生」の関係を観察する際に影響を与える第三の因子を「交絡因子」といいます。これも、調査結果に影響を及ぼします。例えば、観察する集団の性別や年齢は必ず交絡因子として扱います(毒物や薬の影響は大人と子どもで違いますし、がんのように年齢とともに発症率が変わる病気もあります)。「交絡因子」の影響を除かないと、病気の原因になりそうなことと病気の発生に本当に関連があるのかどうかは評価できません。「高齢化によるがんの増加」は、高齢化という交絡因子のわかりやすい例です。「高齢化」を無視して、「○○のせいでがんが増えている!」という論は非常に多いです。

他の例では、「ライターの所持」が「肺がんの原因(危険因子)に見える」というものもあります。実際の肺がんの原因はタバコなのですが、統計を取れば、「ライターの所持」と「肺がんの発生率」には関連があるように見えるでしょう。この場合、「喫煙」が見えない交絡因子として存在しています。

疫学研究では、このようなバイアスや交絡因子の影響を抑えるために、研究計画やデータ解析にさまざまな工夫をします。しかし、知識がない人が行った「調査」や、ある結論を導き出すための恣意的な研究では、偏りや交絡因子についてよく考えないまま行われたり、わざとその影響を利用していることなどがあり得ます。

また、「基礎から学ぶ 楽しい疫学」では、病気の原因になりそうなことと、病気の発生に統計上の関連が認められる場合に、そこに因果関係があるかどうかを判断するための「視点」も提示されています。

[:W360]

  • 「基礎から学ぶ 楽しい疫学」 第二版 p131, 中村好一, 医学書院

(『曝露』は、『病気の原因になりそうなこと』と考えてください)

…と、このように深く考えるとけっこう難しいのですが、私たちとしては「○○が増えると××が増えた、だから○○は××の原因だ」の間に、なにか共通の背景があったり、統計を取る集団に偏りがあるなどの「ウラ」がないか、ということに注意するだけでも、けっこう怪しい情報を見極める役に立つのではないかと思います。


ちなみに、このポスターの「地球温暖化は1800年代から進行しており、同時に海賊の数も減少していますが、海賊不足は地球温暖化の原因ではありません」というのは、ニセ科学を公教育に持ち込むことを皮肉ったパロディ宗教「空飛ぶスパゲッティ・モンスター教」の教義から来ているようです。

この記事について

田口たつみさん @tag_tatsumi とコラボさせていただき、「「ダメな科学」を見分けるための大まかな指針」のポスターについての解説を作成しています。

過去記事