失業率と犯罪率 G7版

【1月18日追記あり。本エントリ最後をご参照】



例の松尾先生のところのアレですが、ブクマコメントにあるように僕も国際比較を見てみたくなったので急遽でっちあげてみました。実働5時間くらい*1の超大作です【そんなにヒマとはsvnseeds】。

とりあえず米国、英国*2、ドイツ、フランス、イタリア、カナダ、日本のG7諸国を調査対象としました。

失業率と犯罪発生件数との相関を見るのはやはりちょっと気持悪いので、ここでは失業率と犯罪率(人口10万人あたりの犯罪発生件数)でみています。

データを探すのが面倒だったので、主に1980年から2006年(国によっては2001年もしくは2005年まで)のデータを用いています。

また、これも面倒なのでt値とp値は計算してません。わはは。【計算してみました。1月18日追記参照】

で、この手抜きサーベイで得られた知見は;

  • 日本の失業率と犯罪率は非常に高い相関を示している
  • 日本以外のG7諸国においては失業率と犯罪率の相関は高いとはいえない(英国では逆相間になっている)

といったところでしょうか。

また、知見とはいえませんが以下の点は面白そうなので誰か調べてくれないかなあ【他力本願のsvnseeds】。

  • 特にフランスにおいて顕著だが、犯罪率が失業率に先行して増減しているように見える現象が観察された
  • 英国、ドイツ、カナダにおける1980年代半ばあたりまでの失業率と犯罪率の著しい乖離(高い失業率と低い犯罪率)や英国の1998年以降の逆の乖離(低い失業率と犯罪率)は社会保障政策と関係ありそうな気がしないでもない

最後にまとめてすべてソースを記してしておきますので、懐疑的な方やりてらしーのたかいかた(棒読み)はご自分で是非お調べいただきたく。IMFと英国Home Officeのデータを使えば、1980年から2001年の間であればG7以外の国について調べるのも容易と思います。

ではいってみましょう。



日本は犯罪率でみてもやっぱり非常に高い相関を示しています。決定係数はなんと0.8816。



【図:日本の失業率と犯罪率 時系列 1980-2006年】



【図:日本の失業率と犯罪率 相関 1980-2006年】


米国。決定係数は0.3107。相関良いとはいえません。でも特に1990年以降はトレンドとしては一緒に動いているように見えます。
また今回は直接関係ないネタですが、こうして並べてみると米国の失業率の変動の激しさというか景気動向に敏感な点はやはり際立ってますねえ。



【図:米国の失業率と犯罪率 時系列 1980-2006年】



【図:米国の失業率と犯罪率 相関 1980-2006年】


英国。データが見つからず1980-2001年の数字を用いています。この期間のデータでは逆相関になってしまうのが面白い(決定係数は0.1384)。1989年以前と1998年以降の乖離って何が原因なんですかねえ。
また、註にも書きましたが犯罪発生件数はNorthern IrelandとScotlandを除くEnglandとWalesの数字を使っているのであまり信頼性のない結果になっています。ご注意。下記ソースにはちゃんと数字あるんで誰か計算し直して下さい。



【図:英国の失業率と犯罪率 時系列 1980-2001年】



【図:英国の失業率と犯罪率 相関 1980-2001年】


ドイツ。これも相関よくないです。決定係数は0.1508。
1990年以降は旧東ドイツ併合により犯罪率、失業率とも大幅に上昇しているためデータに一貫性がないことが影響しているかもしれません。



【図:ドイツの失業率と犯罪率 時系列 1980-2006年】



【図:ドイツの失業率と犯罪率 相関 1980-2006年】


フランス。こちらは1980-2005年のデータ。これも相関良いとはいえません(決定係数は0.1064)。
この期間犯罪率が失業率に対して2-3年先行しているように見えるのが非常に興味深いです。統計の取り方に原因があるんでしょうか。ちなみに犯罪率を2年先行させて調整すると決定係数は0.3790になります。



【図:フランスの失業率と犯罪率 時系列 1980-2005年】



【図:フランスの失業率と犯罪率 相関 1980-2005年】


イタリア。データが見つからず2001年まで。今回の調査対象の中では日本についで相関が良いです(決定係数は0.5355)。
1999年以降失業率が大きく減少しているので2001年以降の犯罪率を見てみたいところ。1992年をピークとする乖離も興味深いです。



【図:イタリアの失業率と犯罪率 時系列 1980-2001年】



【図:イタリアの失業率と犯罪率 相関 1980-2001年】


最後にカナダ。1980年から2006年の期間では決定係数は0.3787。1990年以降をとるとかなり良い相関を示しそうです。ちょっとだけ犯罪率が先行しているように見えるのも興味深いです。



【図:カナダの失業率と犯罪率 時系列 1980-2006年】



【図:カナダの失業率と犯罪率 相関 1980-2006年】

あー疲れた。では皆さんごきげんよう。



【データソース】
括弧内はそのソースのデータを使用した年を示す。


【1月18日追記】

矢野さんにコメントいただきましたので、せっかくだからp値とダービン・ワトソン統計量を求めてみました。

以下まとめておきます。

国名 対象期間 相関係数 決定係数 p値 DW値
日本 1980 - 2006 0.939 0.882 0.000 0.603
米国 1980 - 2006 0.557 0.311 0.003 0.216
英国 1980 - 2001 -0.372 0.138 0.088 0.264
ドイツ 1980 - 2006 0.388 0.151 0.045 0.130
フランス 1980 - 2005 0.326 0.106 0.104 0.494
フランス(註) 1980 - 2005 0.616 0.379 0.001 0.408
イタリア 1980 - 2001 0.732 0.536 0.000 0.501
カナダ 1980 - 2006 0.615 0.379 0.001 0.371

(註)犯罪率を2年先行させたもの

矢野さんのところのコメント欄の松尾先生のコメントにもありますが、ごらんいただければわかるように、どの調査対象データもダービン・ワトソン検定により正の系列相関を示している、という結果になりました。残念無念なり。

残差に系列相関が認められる場合は色々な統計的処理で回避可能らしいんですが、これ以上はちょっと僕の手に余る感じでございます。この続きをやってくれる勇者(または学者)はいないものでしょうか。って僕に言われなくても絶対誰かやってますかそうですか。

なお言わずもがなのdisclaimerですが、上記数字は統計・計量経済学素人のsvnseedsが下記リンク等を参考に猿真似で計算したものですので、これらに基づいて何かを言いたい方は是非ご自分で検算するようお願いいたします。

最後になりましたが矢野さん、いつもコメントありがとうございます。また変なこと書いていたらご指摘いただければ嬉しいです。

*1:内訳:データ見つけるのに2時間、データ整理するのに1時間、グラフ作るのに2時間(笑)。

*2:犯罪発生件数としてEngland & Walesのデータを使いましたがNorthern IrelandとScotlandも加えるべきだったかもしれません。