社会学∩数学≠{ }

自分も割と騙されやすいタチだと思いますが、世の人というのは何がしかの数字を出されると、例えその根拠が不明瞭でも、そこに説得力を感じてしまうようです。集計された数字から意味のある傾向性を見出すには、数字を正しい見方で取り扱う必要がありますが、世の人の数字への不慣れにつけこんで詐術めいた数字の使い方をする例は、政府の調査報告からテレビ番組まで、いたるところに散見されます。

 

(1) 比較せずに特筆する

何らかの数字が突出していることを言うためには、それ以外の数字との比較が不可欠です。それは当たり前のことのはずなんですが、センセーショナルな文脈の中で数字を見せられると、それ単体で(比較すること無しに)意味があるかのように錯覚してしまいます。
例えば、「アメリカのある州において、犯罪者の実に6割以上が日常的にDHMOという物質を摂取していた」という発表があったとすると、ついついDHMOの犯罪誘因性を疑ってしまいがちです。しかし、ここで「善良な市民が日頃どの程度DHMOを摂取しているのか」が対比されていないことに注意すれば、この発表内容は何の意味もなさないことに気付けるはずです。

 

(2) 相関関係を因果関係と混同させる

2つの数字の動きを追ったとき、一方の高低が他方の高低に連動していることを相関関係と呼びます。統計に疎い人がこのような関係を見ると、すぐにそれら2つの数字の間に因果関係があるかのように思うかもしれませんが、それは早計というもの。AとBの間に相関関係が確認できたとしても、実はAとBの両方が隠れた要素Xに起因している、あるいは、AがXに起因しBとXに相関がある、というようなことは珍しくありません。
例えば、「テレビゲームに費やす時間が少ない生徒ほど成績がよい」という調査結果を聞いたとき、「テレビゲームは子供の学力を低下させる」と思ったのなら、あなたはミスリードされています。この例では、「学習時間が成績を強く左右しており、またテレビゲームが学習時間を圧迫している」という実態が推測でき、つまりテレビゲームに限らずとも学習以外のことに時間を費やしていれば成績は下がるという当たり前の話でしかないのです。テレビゲームが直接的に学力に影響しているかどうかを調べたければ、少なくとも、調査対象の生徒を学習時間ごとにグループ分けし、その各グループ内でのテレビゲーム時間と成績の相関関係を見る必要があるでしょう。

 

(3) 都合のいい部分だけ伝える

本当はもっと長い期間・多くの要素について集計しているにも関わらず、自説を強化できる区間・部分だけを抜き出して伝えるというのも、ありがちな手口です。
例えば、長期的な減少傾向を示しているのに、ごく最近の増減のみを取り出して増加傾向を示しているかのように見せるなどということが大手を振ってまかり通ったりしています。
集計回数や集計項目の少ないデータについては、その前後の期間や他の項目が“隠されて”いるのではないか、疑ったほうがいいでしょう。

 

(4) 不適切に加工したグラフを提示する

せっかく正しい数字が集まっていても、その見せ方に手が加えられていたら、見る人には正しく伝わりません。意図的にこのような方法が取られる場合、正しく伝えないことを目的としていると考えられます。
例えば、立体円グラフは使うべきでないという指摘があります。この場合、本来は真円として表示されるべきグラフが縦方向に押しつぶされているため、左右端付近の占有率は上下端付近の占有率に比べて非常に小さく見えてしまいます。数字が付記されていても、このグラフから視覚的に受ける印象によって感覚が歪められてしまい、正しい比率が認識されにくい作りになっています。
あるいは棒グラフの低層部分を(場合によっては省略記号無しに)省いたものも、全体に対する増減比率が非常にわかりにくくなります。加えて、横軸に奥行きを持たせるようなケースすらあり、こういったグラフを眺めただけで数字変化の傾向を把握したと思い込むのは危険です。

 
ニュース全般を疑って見るのはもはやリテラシーとして広く認識されているところだとは思いますが、それらニュースのソース足りうるこの種の統計調査についても、その妥当性について疑ってかかるべきだと思います。