JR東日本によるSuica利用統計データの販売、JR側が謝罪する事態に 157
ストーリー by hylom
収集データを適切に使ってビジネスにつなげられれば良いのだが 部門より
収集データを適切に使ってビジネスにつなげられれば良いのだが 部門より
あるAnonymous Coward 曰く、
先日、日立製作所がSUICAの履歴情報などを利用したマーケティング情報提供サービスを開始するという話題があった。が、Suica利用者からの批判が相次いだため、JR東日本はデータの販売を一時停止するとともに、利用者に謝罪することになった模様(朝日新聞)。
提供されるデータにはSuicaを使って乗り降りした日時や運賃、性別、生年月日が含まれているという。個人を特定できる情報は含まれていないことから、JR側は「個人情報保護法には抵触しない」としていたが、今回の利用者からの反応を受けて9月分までデータの販売を凍結し、また申し出があった利用者のデータを販売分から除外するという。
タレコミ子としてはこのようなデータの利用法はまったく気にならないのだが、/.J読者諸氏のご意見はいかがだろうか?
ITproの記事にて、JR東日本への質問とその回答が掲載されているが、提供されるデータは「乗降駅、利用日時、利用額、利用者年齢(注:具体的には生年月)、性別等を元に個人を特定できないように加工したデータ」で、Suicaの電子マネー機能による購買データは対象外。また、SuicaID番号については元の番号が特定できないように変換して提供しており、また番号の変換方法も定期的に変換しているため「長期間にわたって同じSuicaID番号が一意の番号に変換されることはありません」という。さらに、販売されるデータは乗降者数が多く個人の推定が困難な駅に限定されるとのことだ。そのほか、作業フローもこのデータからの個人の推定を不可能にするため考慮されているという。
無断が駄目 (スコア:5, すばらしい洞察)
以前のストーリーでも散々言われていると思うけど、
無断でやられたら「このようなデータの利用方法はまったく気にならない」のか気になるのか、拒否するのかしないのかを判断する余地なく、既に売られた後だってのが問題。
今回たまたま全く気にならない方法だったから楽観していられるだろうけど、これがとっても気になる方法で無断で行われた後だったらどうするというのか。
Re:無断が駄目 (スコア:5, 興味深い)
同意です。
販売していたのが「個人を特定できないように加工したデータ」だということは、
各種ニュースサイトの記事で初めて明らかになったことであり、
JR東日本の公式サイトに記載があるわけではないですからね。
販売していることが明らかになった当時はその情報もなかったわけで、
「匿名化しているから気にならない」というのは、前提が間違っています。
今回はたまたま匿名化されていただけで、実は他のケースでは、匿名化せずに
販売しているのかも知れない。
プライバシーポリシーを公表していないのだから、どこからどこまでの範囲を
個人に紐付く情報として扱っているのか、定かではないわけで。
やましいことがないのなら、初めからプレスリリースとして詳細を
公表したら良かったと思いますよ。
それなら利用者の反発もずっと少なかっただろうし、なんなら
購入を希望する会社が連絡してくるかも知れないのに。
Re:無断が駄目 (スコア:1)
乗降駅、利用日時、生年月
知り合いとかなら十分に個人特定出来るデータでないかい?
Re:無断が駄目 (スコア:5, すばらしい洞察)
>これは現状の「常識」が果たしてどこにあるのかという問題でもある。
これは個人的な意見ですが、ビッグデータに関するそのような「常識」は、
まだコンセンサスが取れていない問題だと思います。
なので多くの企業は「プライバシーポリシー」という形で、自分の中の
「常識」がどういったものなのか、公表しているのだと思います。
実際匿名化した統計データを他社へ渡している会社は多々あるわけで、
プライバシーポリシーを公開していれば、騒がれることもなかったのでは。
Re:無断が駄目 (スコア:3, すばらしい洞察)
あまり選択変えできないインフラ各社が顧客の情報を一部でも売り始めたらどうなるか悩ましいし
日本の基礎基盤を荷い守る企業が、ずさんな形でデータを売ってるのがなんか好かん。
インフラ業として法より高い理念が有るとかだと嬉しかったんだが、JR東日本からの釈明では
法に触れなきゃなんでも売ります、って宣言で今回の件だけの問題でなく今後信用していいのか疑わしい。
個人が特定できないデータならどう扱おうと法に接触しないから勝手、と企業側が考えるのは勝手だけど
その気になればID毎の明細が作れそうなデータ、利用者と企業の2者の取引・利用情報を売ったと思うと
顧客側から企業を信用出来なくなる。
個人情報保護は、情報が流出しても各個人にダメージが出にくくする為のデータの扱い方をする為のものであって
それを消せば売り物にしていいと考えていいと思ったことはない。JR東はそう考える奴が指揮をとっている。
物事の意味を考えないで指揮をする人間の酷さを思うと、今より先が信用できなくなる。
#名前を隠しても明細を公開して欲しくないのが幾つかある
Re:無断が駄目 (スコア:1)
しかし、
とっても気になる方法が無断で行われるのは問題かもしれないが、
気にならない方法であれば無断でも問題ないという考え方もあるだろう。
別のコメント [srad.jp]にもあるとおり、公表されていない限り、それが「気になる方法か気にならない方法か」は分からないのだから、「気にならない方法である」という確定した状況があり得ないんじゃないですかね。
今回の記事で明らかになった「長期間にわたって同じSuicaID番号が一意の番号に変換されることはありません」という話にしても、本当に当初からそういう設計だったのか、反発をうけて慌てて対処することにしただけで、反発が少なければずっと同じ番号に変換するつもりだったのか、私にはわかりません。
Re:無断が駄目 (スコア:1)
使いたい人は少なくとも万人を納得させる努力はしないと。
Re:無断が駄目 (スコア:1)
ららぽーとにある広告を表示するディスプレーにはカメラが隠してあって、広告を見た人の性別年齢を集計しているそうですが、それが発展すればそうなるよな。
Suica返却済みだと除外申請できない (スコア:5, 興味深い)
Suicaをすでに返却している場合、手元にないのでIDもわからない。
そういう人は除外の申請ができない
もう使ってないんだから関係ないだろ、というわけでもなく、
過去2年5か月分 [yomiuri.co.jp]を提供するつもりらしいので
ここ1,2年に返却した人もばっちり含まれてしまっている。
#つーかこの「過去分」の話はJRのサイトにあがっているPDFにないんだよな。
オプトインならこんな問題もないというのに、どうしてこんなことをしたのやら…
ということをメールで問い合わせ中
個人が特定できるケースもあるよね。 (スコア:5, すばらしい洞察)
「乗降駅、利用日時、利用額、利用者年齢(注:具体的には生年月)、性別等を元に個人を特定できないように加工したデータ」
ってことですけど,これだけあれば個人が特定されてしまうケースは多々あると思われますが…。
長距離通勤で,余り他の人が使わない乗降駅を使っているケースなんかだと,そもそのそのルートで使っている人が一人しかいないことも想定されます。
(私もそれに該当しそうですが。)
また,拒否したい人は連絡すれば除外されるということですが,このような「オプトアウト方式」で対応したつもりになってしまっているのは問題でしょう。
そもそも利用規約に全く書かれていなかったわけですし,新たな利用規約を作って,それを「オプトイン方式」でデータの第三者利用を了解した人のみ対象とすべきではないでしょうか?
その上で,データ提供の対象とする人には鉄道利用時のポイント付与などの「インセンティブ」を与えるのが正当でしょうね。
(現状,Suicaポイントクラブに加入したとしてもポイント付与の対象となるのはSuicaでの購買分だけなので)。
Re:個人が特定できるケースもあるよね。 (スコア:2, 参考になる)
人気の無い駅で毎週決まった時刻に降車する女子高生のデータとか
Re:個人が特定できるケースもあるよね。 (スコア:3)
Re:個人が特定できるケースもあるよね。 (スコア:2)
販売されるデータは乗降者数が多く個人の推定が困難な駅に限定されるとのことだ。
この件ですが,JR東日本に問い合わせた方が,こういう回答を貰っています。
Suicaに関するデータの社外への提供に関して問い合わせてみました。PASMOなど Suica以外は収集していない。利用者が3桁に満たない駅は公開されない。IDの更新期間は言えない。個人情報と考えない為今後も許可は得ない
https://twitter.com/nagamatu/status/360601206084739074 [twitter.com]
「利用者が3桁に満たない駅は公開されない」ですか…。
私が利用している駅は片方は数万人,もう一方も数千人の乗降客がいますが,その両方を日常的に使っている人はたぶん私一人でしょう(仮に他に居たとしても片手で足りる程度)。
別にやましいことはしてはいませんが,これでは「個人が特定できない」とは言えませんよね?
論点が違う (スコア:4, 興味深い)
>タレコミ子としてはこのようなデータの利用法はまったく気にならないのだが、/.J読者諸氏のご意見はいかがだろうか?
それは論点が違うような。
SUICA 導入時からこれまで「第三者への提供」が明言されていなかったにもかかわらず、
今になってJR側が問題無いと判断し、第三者への提供が開始されることについて、
批判されたのではないでしょうか。
JR社内で利用されることに異論はありません。
情報を売るつもりなら、最初からそう言ってくれと思います。
Re:論点が違う (スコア:1)
確かに、JR東日本企画あたりが、このデータを使った広告やコンサルをする分には、
非難されなかったかもしれませんね。
コンサルタントって、結局、マーケティング情報提供サービスに他ならないわけですが、
情報管理の主体があくまでもJR側にあるという建前が重要なわけです。
日立ではなくJRがやっている、データそのものではなくあくまで「コンサルタント」、
こういう方便が足りなかった。
プライバシーポリシーはデータの一部に適用されるのか? (スコア:1)
JRに限らず、最近のまともな会社だと、プライバシーポリシーを提示して同意を取るような形になってると思います。
たいていの場合、
・利用目的
・収集するデータの種類
・第三者提供の方針
等が決められています。
たとえば、
利用目的: サービスの提供に必要な連絡のため
収集するデータの種類: 住所、氏名、年齢、性別、生年月日、その他もろもろ
第三者の提供の方針: 法令に基づく場合を除き行わない
というプライバシーポリシーを提示して個人情報を収集した場合、
「集めた情報から、個人を特定できる、住所、指名、を除いた他のデータを、
上記のポリシーに反して、利用しても良いか?」
という問題があると思います。
「住所、氏名を除いているので、個人を特定できないから個人情報には当たらない(=プライバシーポリシーの対象外)」
となるのか?、それとも、
「プライバシーポリシーを提示して集めたデータなので、個人を特定できるデータを除いてもプライバシーポリシーは適用される」
と考えるのか?
今回の件は、たぶん前者の考え方で、
個人的には後者が妥当だと思うのですが、みなさんはどうでしょう?
Re:第三者でなくなればいい (スコア:2)
証券会社のように、社内でファイアウォール規制が必要になるでしょうね
敢えて言おう。カスである!と。
オプトアウトでいいのか? (スコア:4, すばらしい洞察)
Suicaのデポジット料を払う際に 統計データ利用を許可する/しない って選択できるようにするべきなのでは.
JRならそのくらい簡単にシステム構築できるはずだし,自分のSuicaの個人データを巡って何が起きるのか・その利用を許可するのかを明確にできるフェアなやり方だと思う.
なんでもかんでも個人情報の時代 (スコア:4, おもしろおかしい)
JR東日本に対する取材内容がどうだったのか知ろうとするには、
今度はITproに個人情報を登録しなければならず、なんとも世知辛い世の中ですな。
それはともかく、情報提供の概要はだいぶ見えてきたのですが、まだ利用方法次第では悪用できそうな
余地を残しているような気がします。
例えば、従業員の素行調査とかに使えそうですね。
使用者は従業員にsuica使用を実質、強制できる上に、なにかの業務命令を名目にして、
従業員に決まった移動行動をさせることもできるでしょう。
その移動情報をうまく検索条件に設定すれば、正確ではないにせよ素行調査ぐらいできそうですね。
自宅と会社だけを行き来するだけの従業員、遊び回っている従業員、
自宅とは別の所に時折宿泊している形跡のある従業員、
こんなのを分析することは、可能なようにも思います。
Re:なんでもかんでも個人情報の時代 (スコア:1)
ばれたりすると、会社自身の信用に関わりますね。
# どうして人は徽章を付けると傍若無人になるのだろう
除外希望 (スコア:2, 興味深い)
データ提供対象から除外するには
メールか電話でsuicaのIDを連絡してくれとあるが
興味深いのはメールは自動処理だそうだ
IDを連番ですべて申請したらどうなる
Re:除外希望 (スコア:5, おもしろおかしい)
さらにメールアドレスまで提供するというのか
Re:除外希望 (スコア:2)
いずれにしろ、申し入れがあれば使わないという条件は先に提示しておくべきでしたね
JRとしては「拒否される割合」を織り込めばデータの精度には大した影響もないですし、もう少し騒ぎもマシになったでしょうに。
どのくらい拒絶反応が出たかは知りませんが、何千何万とか何十万という莫大な数の統計からすれば一個人のデータはそう特定できるものではないでしょう、同じ条件の人なんて腐るほどいますので。
Re:除外希望 (スコア:1)
>IDを連番ですべて申請したらどうなる
業務上威力妨害で告発されるんじゃね?
Re:除外希望 (スコア:3, 参考になる)
駅の券売機で連続で数枚SUICAを購入したら
本当に連番でした。
発行してるしていないは管理してるだろうけど
連番っぽいです。
Re:除外希望 (スコア:1)
ユーザーに見えるIDi(SuicaならJE~~)は連番とは違います。
連番に見えるパターンもありますが、パリティが入ってますので十数枚連続して買えば単純な連番ではない事が解ります。
Re:除外希望 (スコア:2, 興味深い)
IDiには1バイトのチェックディジットがあるけど、ある部分の値を+1するとチェックディジットも+1になるような計算方式なので、同じ券売機で連続発行すると連番のIDiが振られるんじゃないかな。
意見というか個人的感想です (スコア:2)
個人的な感想を述べても良さそうなので、
ちょいと思うところを・・・
私は今回のケースについては、
事後報告でも許せる範囲かなと思っています。
ただ、許せなかった人たちの気持ちを想像するに、
便利なカードを無用な心配なしに使いたい。
という気持ちが表に出たのかなぁ。
ふと振り返ってみて、
・SUIKAを買うときに、個人情報は何も提示しなかった。
・よく利用するコンビニでは、見た目の年代と性別、あと身長?かな?
・利用した店舗情報は、許せる
・SUIKA決済の時に個人情報の提示を求められたことがない。
ということで、警察が動くような事態を
自ら招かない限りは心配無さそうだと思いました。
ただし、電子データは一度漏れたらアウトらしいので、
妹を人質に取られた兄が(以下自粛
で、下世話な話もちょっと。
ビッグデータの活用(販売)で、どれぐらい儲かりまっか?
:p
#一番の理由はやっぱり嫌儲なんだろうな
【犀の角のように進みたいけどムリ】
嫌儲は半分正義 (スコア:1)
コメントにコメントは何だけど、「嫌儲」自体は、否定されるべきじゃないかと思う。
何しろ、「金銭」は一次元の線形データと云う、あまりにも単純化された数値なんで、「金銭換算」を全ての基準にするのは、あまりにも危険且つ無能な行為。
それに対する最大の抑止策が「嫌儲」だから、否定する事だけは止めて欲しいと思う。
-- Buy It When You Found It --
Re:意見というか個人的感想です (スコア:2)
JR東日本の発表資料読んでますか?
http://www.jreast.co.jp/pdf/20130725_suica.pdf [jreast.co.jp]
あなたが恐れている事態が起こらないように気を使って取り扱ってるように見えます。
提供データも生年月日ではなく、生年月ですね。
自分のデータがどう使われるかわからないのは怖いというのはわかりますが、
使われ方を勝手に想像して恐怖心煽るような書き方はこの件では筋が良くないと思います。
Re:意見というか個人的感想です (スコア:2)
いや、実際問題、本当に目の前にある危機でしょう。
別の投稿で、従業員の素行調査の話をしたので、別の例を考えてみますか。
例えば、特定、政治家や芸能人などの著名人を追う記者やら、探偵の中には、
なんとかして、移動履歴が知りたいと思っている人も少なくないでしょうし。
彼らは、特定時間に対象者を呼び出し、それを記録し、Suica情報の検索依頼をして
複数の結果から、行動履歴を割り出すなんてことは、積極的に試みるでしょう。
なにしろ合法なのですし。
一つの組織からの検索依頼では個人を割り出すのが無理でも、
複数の組織を使って検索依頼をして差分を取ったら、果たしてどうでしょうかね。
特定個人の移動履歴を探し当てることができるか、未だ誰も検証もしていないから、誰にもわからないんです。
「個人を特定できないように加工した」がそもそも信用できない (スコア:2)
とりあえず (スコア:1)
個人を特定できる情報は削除されているとの事だけど、これだけの情報があれば高い確率で個人を特定できると思うよ。
個人が特定できないなんて、まやかしでしょう。
Re:とりあえず (スコア:3, 参考になる)
高木先生が山手線一周したら、同じ携帯が何処の駅で降りて乗ったかが解った [takagi-hiromitsu.jp]みたいなことは起きるんだろうな
Re:とりあえず (スコア:3, 興味深い)
SUICAのカード1枚1枚の乗車記録が残されている事自体が気持ち悪いです。
本来なら精算が終われば必要のない情報です。
クレジットカードの利用履歴を名前だけ伏せた状態で公開されるのと同じだと思います。
嫌がる人は確実にいます。
Re:とりあえず (スコア:3)
Suicaって「鉄道利用時のポイント」は付かないですよね。単に「タッチアンドゴーで改札抜けられる」というだけのメリットで,果たして履歴使われるだけの対価になっているのかどうか…?
購買時のポイントなら別途Suicaポイントクラブに入れば溜まりますけど,そのためには個人情報を登録して,履歴の利用に許諾する必要がありますね。
鉄道利用時もきちんとこういう形でポイント会員として登録させて,100円1ポイントくらいのポイント溜まるようにさせれば良かったんじゃないかと思います。
現状ではデータ提供の許諾をした覚えはないし,ポイントは付かないし・・・ で全く釣り合ってないです。
生がいちばん (スコア:1)
ローソン「31位の菓子パンを売り続ける理由」 [president.jp]のようなことをしようと思ったらこんな加工されたデータじゃ駄目なんじゃないかな?
前のストーリーでも日立はここからさらに加工されたレポートを売るって話だったし。
自分が直接触れられないビッグデータに価値はないと思う。
Re:生がいちばん (スコア:1)
自分が直接触れられないと価値はないという意見に賛成。
加えて、今回のお題目の「出店計画や広告宣伝計画などに活用」に限っていえば、4,000万人分を扱う必要もないと思う。間引いて40万人分にしても、たいして問題はない。
これさぁ (スコア:1)
生年月日ではなく、年齢だったなら
苦情は来なかったんじゃないのかな。
日々同じルートを使っている人は
「年齢でなく生年月日なら自分を特定できる」
と思いかねない。
Re:正直騒ぎすぎ (スコア:5, おもしろおかしい)
匿名の臆病者がそれを言うのはギャグの一種なんでしょうか。
Re:正直騒ぎすぎ (スコア:1)
有料で売り物になってる時点で説得力ないわ
Re:正直騒ぎすぎ (スコア:1)
個人情報と統計情報がごっちゃになってるなあ
Re:正直騒ぎすぎ (スコア:1)
誰も興味ないなら、販売する理由もないということだな
Re:オプトアウト方式希望 (スコア:2, おもしろおかしい)
> オプトアウト方式希望
> オプトイン方式にして欲しい
ごめん。ちょっと難しいwww
Re:オプトアウト方式希望 (スコア:1)
岩手県議の小泉光男先生なら、ID(番号)で呼ばれることがお嫌いなので、進んで登録されるはず。
Re:切符と同じ情報までなら良い (スコア:2)
>だけど、誕生年月日と性別は余計な情報だろ
ちなみに「生年月日」じゃなくて「生年月」らしい。
つまりは、事実上の年齢が欲しいんじゃないの?
「何歳~何歳の人は、XX日にこの駅で降りることが多い。
それは、この日開催された花火大会を見に行くからではないか。」
みたいな情報に繋がるから。
Re:切符と同じ情報までなら良い (スコア:1)
そう私も思います。
おそらく個人の特定や長期追跡は興味がなくて、
コンビニのレジで打ちでやってるような購入行動+性別+年代が欲しい。
レジ打ちと違うのは、年齢性別に売り子の主観が混ざらないこと…
いくら若作りして改札機をくぐっても無駄。
Re:切符と同じ情報までなら良い (スコア:1)
流通先で追跡されないなんて言ってませんけど…
「JRは興味ないまま流通させちゃってるんだろうなあ」と言っただけで。
Re:GPLライセンス開示開示要求いじめ (スコア:2)
それは違う。
ライセンスを適切に運用したいだけだろう。
これを放置すると、GPLコードを自社製品に不正使用する輩だって出てくるからな。
そういう所はミッキーマウスでもアップルのロゴでも同じ。
Re:犯罪でしょ (スコア:1)
犯罪って、何の法律に反しているというわけ?