大量の情報を蓄積できる「ビッグデータ」の時代を迎えて、強く求められるのが情報を正確にかつ効率的に分析するデータサイエンティスト。小さな情報から宝を見つける仕事で、「今、最もセクシーな職業」と言われる。
とはいえ、新しい職業だけにロールモデルはまだ少ない。データの分析でどう仕事の成果を高めるか、働き方も方法論もまだ確立されていないのが実情だ。時代の先端を走る第一線のデータサイエンティストになるためにはどんな心得が大切か。本連載では、データサイエンティストらの仕事や人柄を紹介しながら、その仕事に就くための条件を考える。
今は米ヤフーのCEO(最高経営責任者)であるマリッサ・メイヤー氏は2009年夏のある日、東京・渋谷の会議室にいた。当時は米グーグルの副社長。共同創業者のラリー・ペイジ氏と一緒に日本法人を訪れて、筆者のインタビューに答えた。
メイヤー氏がグーグルの最先端の研究として紹介したのが、検索数とその推移から災害や疫病の広がりを予期することだった。
テレビで台風情報が紹介されたら、誰もが天気を気にするようになる。どの国のどの地方に住む人々がどれくらい台風の情報を検索しているか。身近に迫っている地域の人々ほど小まめに検索するはず。であれば、検索推移を見ていると台風の被害や方向などが分かるのではないか。メイヤー氏の説明はそうしたものだった。
ヤフー現CEOが東京で明かしたデータ分析術
メイヤー氏の東京訪問と同じ年に、医学界ではグーグルの名が一躍知れ渡った。グーグルのチームが「季節性インフルエンザの流行」を検索行動から予期したと学会論文に発表したからだ。
熱や咳など上位検索数と季節性などを分析していくと、インフルエンザの広がりを示した米政府のデータとの相関関係が証明されたというもの。検索パターンから米政府と同じように流行を予測できるというわけだ。
お店の情報やニュースの検索だけではなく、災害や病気の傾向までグーグルが「予測」できたのは、優れた頭脳の「データサイエンティスト」社員がいることに加えて、大量のデータを蓄積できる「ビッグデータ」時代が到来したことも大きい。大量のデータをとにかく貯めておけば、新しい分析や試みができるわけだ。
グーグルの予測が一定の評価を得たのも、大量の検索データを解析したことによる。世界では1日30億件の検索がされていると言われるが、この膨大な数を扱っていること自体が大きな価値なのだ。
人々が何気なく検索した言葉。それが大きな価値を生む。グーグルの例からお分かりになっただろう。
データサイエンティストと言えば、数学や物理、統計学などに優れていることが条件とされるが、それだけではない。むしろビジネスで成果を出すためには「小さいデータ(数字や言葉など)に徹底的にこだわる」ことが大切な心得になるのではないか。
そんな思いを強くしたのは、『データサイエンティストに学ぶ「分析力」』(日経BP社)の著者であるディミトリ・マークス氏にインタビューしたことがきっかけだった。