ヤフー、検索数のビッグデータから参院選の結果予測
自公で71~78議席、民主は19~22議席
ヤフーは2013年7月8日、「Yahoo!検索」の検索データを基に予測した、2013年の参議院議員選挙の結果を公表した。同社で、選挙の予測を投票日前に公表したのは初めて。

ヤフーでは、2012年12月16日に投票が行われた第46回衆議院議員総選挙において、12月4日~15日の検索データと選挙結果の関連性を選挙後に分析した。その結果、例えば政党名の検索件数と比例区の得票数の間にはかなり強い相関(相関係数0.946)があることなどが分かった。それ以外に国政選挙と地方選挙を1つずつ分析したときも、同様の関係が見られた。

そこで今回は、5月28日から6月21日までの検索データを基に選挙結果を予測し、投票前に発表することにした。ヤフー執行役員で事業戦略統括本部統括本部長の安宅和人氏は、「検索数と投票に非常に強い関係があると分かって、我々自身が驚いた。これを見て、予測を事前に公表する気になった」と公表理由を説明した。

今回の予測では、検索量が多ければ得票数も増えるという相関をそのまま利用する「相関モデル」と、「選挙前に盛り上がる度合い」を加味した「投影モデル」という、2種類の予測モデルを用意した。
投影モデルにおける「選挙前に盛り上がる度合い」とは、選挙期間中の検索量を平時の検索量で割った値で、選挙前に活動が活発になる政党では高くなる。そうした政党の候補者は得票数が増えると予想する手法だ。
同社は、この相関モデル、投影モデルのそれぞれを選挙区、比例区に当てはめて獲得議席数を政党別に予測した。結果は以下の通り。
相関モデルは、自民59、公明12、民主22、維新16、みんな4、共産6、社民1、その他1で、投影モデルでは、自民67、公明11、民主19、維新9、みんな5、共産8、社民1、その他1という結果になった。どちらのモデルでも、自民・公明の2党で過半数に必要な63議席を獲得できる見通しだ。
同社では、6月16日~7月3日(東京都議会選挙の影響が強い6月23日~28日は除く)の分析結果を7月15日前後に、7月8日~7月15日の分析結果を投票日の直前に発表する予定だ。
(日経パソコン 大橋源一郎)
[PC Online 2013年7月8日掲載]