「データは新しい石油」という言葉がある。ビッグデータ界隈でよく引き合いに出される言葉で、なかなか意味深である。いろいろな用途に使える、パワフルな次世代情報産業の基本エネルギーだが、漏れたら大変。掘り出して精製するという工程も何となく似ている。
2月29日~3月2日にかけて、シリコンバレーでビッグデータのカンファレンス「Strata2012」が開催された。キャッチーな「ビッグデータ」という用語をこのカンファレンスで流行させた仕掛け人、ティム・オライリー氏自身が今年は登場せず、大物ゲストもいなかった。それでも参加者の数も展示の規模も、昨年の倍以上は軽く超えていただろう。
カンファレンスの中身は、「先進的プレーヤーの事例とコンセプト」が多かった昨年から、「多種の企業で普通に使われる技術」という地に足が付いた段階となってきていることが感じられた。
熱気に満ちた会場には、昨年ほとんど見かけなかった日本人の参加者が、今年は大量にやってきた。日本でもビッグデータが「バズ」となっていることがうかがえる。
娘の妊娠を親より先にスーパーが察知した事件の波紋
カンファレンスでは、先進国共通の課題である「プライバシー」に関するセッションがいくつかあった。下手に扱えば、「ビッグデータ=プライバシー侵害」というイメージがこびりつく。貴重な石油原料が十分に蓄積されないという危機感は、日本に限らず米国も欧州も共通であり、テクノロジー業界としてきちんと対応しなければいけない。
折から日本でも、「グーグルで自分の名前を検索すると、サジェスト機能で犯罪と関連のありそうな用語が表示される」という問題で、男性がプライバシー侵害などを理由にグーグルを訴えた件が話題となっており、データとプライバシーについての関心が高まっている(なお、裁判所はグーグルに表示をやめるよう命令したが、グーグルは今のところこれに従っていない)。
昨年秋には、このコラムでビッグデータの定義と使い方について書いた(関連記事:グーグルとフェイスブックが「別格」たるもう1つの理由、「マネーボール」から医療まで、難問を解決するデータの力)。今回は個人情報を中心とする「データの原料供給」について、Strataカンファレンスでの議論や、ネットとオープンの時代におけるプライバシーについて論じたジェフ・ジャーヴィスの著書「パブリック・パーツ」などを参考にして、ちょっと考えてみたい。
前のコラムからの繰り返しになるが、ビッグデータという考え方や技術はそれほど新しいものではない。ただ、以前は扱う大量データの中身が、株や債権の取引情報、気候や天体の観測データなどといった「無機的」なものが中心であった。
それに対して、ここ数年は、ネットでのユーザー生成コンテンツやソーシャル情報といった、人に関する「有機的」なデータが大量にクラウドに蓄積されて活用されるようになり、技術的にはより不定形なデータが扱えるように変化してきている。
データでプライバシー問題を引き起こすのはネットに限らない。この1月、「ターゲット事件」がアメリカのネット界隈で有名になった。ターゲットとは、米国の大手総合スーパーで、衣料・雑貨から食料品まで種々の品目を扱っている。日本で言えばイトーヨーカドーやイオンのような存在だ。
ターゲットでは、クレジットカードで買い物をしたユーザーの購買情報を解析し、購買行動に合った品目のクーポンをユーザーに送っている。このクーポンを巡って事件が起きた。とある父親が、「10代の娘になぜ妊婦向けのクーポンを送ってくるんだ!」とターゲットに怒鳴り込んだのである。
結局、この娘は本当に妊娠しており、後に父親はターゲットに謝った。しかし、なぜ親さえ知らない娘のプライベートな事情をターゲットが知り得たのだろうか。
娘が、マタニティー用品をターゲットで買ったことがあるわけではない。しかし、過去の膨大な購入データを関連づけて解析すると、例えば無香性のクリームや牛乳といったような、一見関係のなさそうな品目の購入履歴から妊娠の確率の高い人を割り出すことは簡単にできる。その経緯が、ニューヨーク・タイムズやフォーブスに掲載されて、話題になってしまった。
疑心暗鬼に陥り始めたメディアやユーザー
ちょうどその前後にグーグルがプライバシー・ポリシーの変更を発表し、3月1日から実施された。その日にちょうどStrataカンファレンスではプライバシーのセッションがあり、グーグルの法務担当者が、同社のポリシー変更について発表した。
グーグルのサービス同士で横断的に当該ユーザーの情報を共通化して共有し、別々にログインしなくても、よりピンポイントに情報を表示することができるようになる。ちなみに、かねてからグーグルを問題視しているEU(欧州連合)は、またこれにかみついている。
昨年4月には、アップルがiPhoneの位置情報を無断で自動的に記録していたとしてヒステリックに取り上げられたり、ワシントンでも個人データ収集を制限する法律が検討されたりするなど、プライバシー問題はヒートアップしている。
メディアやユーザーの間に、「私の個人情報をタダで勝手に取られる、そのデータを使って私に余計なものを売り込んで、あいつらだけが儲けている」→「けしからん、だからデータは取られないようにしなければいけない」という疑心暗鬼な論調が広がっている。
【初割・2/5締切】お申し込みで…
- 専門記者によるオリジナルコンテンツが読み放題
- 著名経営者や有識者による動画、ウェビナーが見放題
- 日経ビジネス最新号13年分のバックナンバーが読み放題