ネットの友だちを見れば誰がゲイか分かる:MIT Project “Gaydar”



In the social networking age, coming out is not a personal choice any more.

That's what MIT students, Carter Jernigan and Behram Mistree, found out with an experiment “Gaydar” in 2007. They downloaded the Facebook friends of 1,544 men who said they were straight, 21 bisexual, and 33 gay men, and trained their computer program to analyze them. Then they did the same analysis on 947 others whose sexual orientation was not published on the web. Surprisingly the program predicted all 10 gay men, though it failed to accurately identify lesbians or bisexuals. In short, gay men may be outing themselves before they know.

About a decade ago, Dr. Latanya Sweeney of Carnegie Mellon University conducted another experiment, using public anonymous data from the 1990 census, and found that the combination of gender, ZIP code, birthdate uniquely identifies 87% of U.S. population (city:53%, county:18%).  Scary isn't it?

Arvind Narayanan and Vitaly Shmatikov, researchers of University of Texas at Austin conducted similar research using Netflix rating database this year, and the report “De-anonymizing Social Networks”is now available online.

Seemingly anonymous data can sometimes be very personal.  Maybe internet anonymity is just a myth.


類は友を呼ぶ。
英語では「birds of a feather flock together」。社会学では「homophily principle」。

似た者同士がつるむのは今に始まったことではないが、交友関係が表に出るソーシャルネットワーク全盛の今、これが新たなプライバシーの懸念を生んでいる。

Facebookの友だちを見て誰がゲイか当てる」実験を2007年に行ったのは、マサチューセッツ工科大学(MIT)の学生Carter JerniganさんとBehram Mistreeさんだ。2人は同大2007~2011年卒業予定者と院生のプロフィール情報をFacebookからダウンロードし、性的指向をサイトに公表しているストレートの男性1544人、バイセクシャルの男性21人、ゲイの男性33人の性別・性的傾向・友だちリストをコンピュータプログラムに教え、分析させた。するとゲイの男性はストレートの男性よりゲイの友だちが多く、これがゲイ判定の手がかりに使えることが分かった。

その上で同じ分析を、性的指向がサイトに明示されてない947人について行わせてみたところ、別口の聞き込みでゲイと分かってる男性は10人中10人とも「ゲイ」と当てられたんだそうな(バイセクとレズビアンの命中率は低かった)。こんなピッタリ当たるんじゃカミングアウトもへたくれもありゃしない。

因みに、「匿名情報」も思ったほど匿名ではないという点について、今から約10年前に警鐘を鳴らしたのは、カーネギーメロン大のラタニャ・スウィーニー博士だ。女史は2000年米国勢調査で公けになっている情報を使って、どの程度まで個人が特定できるか実験を行った。結果、「郵便番号、性別、誕生日」の3拍子揃えばアメリカ全人口の実に87%は個人の身元が特定できることが分かった(郵便番号が市町村だと53%、郡だと18%)。

同様にテキサス大オースティン校のArvind NarayananさんとVitaly Shmatikovさんは今年、Netflixの映画評データベースから個人を割り出す実験を行い、その結果を「De-anonymizing Social Networks」という論文にまとめ公開している。

ウェブには交友関係、宗教、政治信条、性嗜好、好きな本・映画・音楽・スポーツなどなど身元特定やプライバシー露見に繋がるデータの断片が溢れている。ネットの匿名性なんて幻想なのかも。


[The Boston Globe]


Last Updated at 16:57 on Sept. 21, 2009.

Comments