ホームページを作る人のネタ帳

mixiのユーザーのプロフィールを外部へ持ち出し、データベース化するシステムは作成可能

(2007/7/29 11:11更新)
追加記事は記事の最後に

全国のmixiユーザー達。

SNSとは?と聞かれて答えれますか?
閉鎖的?小規模日記?

そんなのは昔の話。
そろそろプロフィールに本名を、何も考えずに入力する事についてちゃんと考えてください。

なぜか?

プロフィールはmixiアカウントを持っていない人でも、ある方法で見れるからです。

え?なんて今更聞かないでくださいね。
会員数1000万人突破している時点で、プロフィールを全体に公開している人は居ますけど、そんな規模じゃありません。

インターネットユーザー全てが、あなたのプロフィールを見ることが出来ます。(今のところ)

簡略的に次のようなシステムを構築します


【使うもの】
http://mixilabo.com/index.cgi?fn=get_friend_home&id=
・PHP(私がPHPユーザーだから)

作業を簡略化させるため、ミクシーマイザーをAPIにしてシステムに組み込む。

ためしにid=のあとに適当に数字入れてみるとわかります。
会員数が1000万人分の数字入力が可能。

既に退会している人もいるけど1~10000000まで適当に入力していけば、プロフィール画面をミクシーユーザーじゃなくても確認できるのがわかります。

何件か適当に数字を入力するとわかりますが、所在地と本名の公開している人の数は膨大です。これは非常に危険な状態であると考えてください。

プログラムの中で、$url に数字を入れたURLを渡し
$string=file_get_contents($url);
これで情報を採取します。

採取した情報をエンコードし、
$pattern = "/<h1[^>]*>(.*?)<\/h1>/i";
$result = preg_replace_callback($pattern, "toh1", $string);
こういう特定箇所抜き出しを行えば、名前や所在地だけを抜き出すことが可能。
(※これはh1タグの中の文字を抜き出すプログラムのサンプルで、直接これを使っても名前を抜き出しません。作成されるときはご自身で法則を発見しそれように変更を加える必要があります)

ミクシーマイザーAPIを使って採取できる範囲は限られているけど、名前、ハンドルネーム、マイミク9人まで、紹介者は採取できると考えられる。
また、全体に情報を公開しているユーザーは、所在地(市町村)まで同時に採取される。

さらに参加しているコミュニティーも同時に抜かれる。


これらの情報を自分のデータベースに保存する。

これを例えば1~100まで、100回繰り返す。
すると、名前検索が可能となる。

この時点で、所在地を全体に情報を公開し、さらに実名を使っている場合は、高確率で個人を特定される恐れが強い。

さらに、データベース化を簡単にできると言う事は、全体に公開していないユーザーも、個人を特定できる要素が生まれる。


データベースが100万件になったとき


ミクシィプロフィールが100件のデータベースを入手したとき、次のようなリレーを行う事が出来る。

1)マイミクの連結
マイミクに登録されているハンドルネーム一覧からそのマイミクの連結が可能となる。
あなたが所在地を公開していなくても、マイミクが公開していた場合、ある程度の予測が可能となってしまう。

2)コミュニティーの連結
コミュニティーにも、実は所在地を特定させる要素もある。
また、出身校などのコミュニティーも個人を特性させる要素に変化する。

3)所在地検索が可能になる
全体に公開しているユーザーだけの検索が可能になる。
検索窓に、北海道と入力すれば、全体に所在地を公開している人の一覧が登場し、そこに本名があれば、ほぼ確実に個人を特定される。

これだけでも相当なリスクを背負うことになるのが全体への公開だ。
それ以上にさらに考えられるネガディブな想像を膨らませてみる。


趣味、趣向なども採取可能


ブログアドレスをmixiプロフィールに公開している人も、個人の特定をされる。

ブログで公開した内容と、参加しているコミュニティー。
そして、日記のタイトル(全体に公開している人)の3つを連結させると、ある程度その人の趣味や、趣向なども見えてくる。

あなたの趣味や、仕事なんかも見ず知らずの人に持っていかれるのだ。

あなたが大好きなアーティストのコミュニティーに参加している事がわかれば、あなたに対して最も効果的な広告を提供するのも簡単だ。


内部からの情報持ち出しはもっと怖い


これに関しては前回書いた記事。
mixiを徘徊しているロボット達。あなたのマイミクは本当に人間か?*を見てもらえればわかるけど、より個人を特定されやすい。

是非とも楽しいmixiライフの為に、本名の公開だけは避けたほうが良いと警告させて頂きたい。

では。

追記
この記事で紹介した方法は現在使えません。
本記事を公開してから1日で内部からの情報送信を行っていたmixiユーザーのアカウントが消されたためです。

流石ミクシィです。
@yamada_nt
Posted by@yamada_nt
スポンサードリンク

Comments 17

There are no comments yet.

hg  

これはいい搾取ですね

"逆に"
マーケティング以外にも趣味とかでも使えそうですね。

往々にして素人が本名やら所在地やら書いてるのが多いわけですが
そういう人たちは痛い目見て勉強してくださいってことですかね。

2007/07/26 (Thu) 11:02

おやじです  

mixiの規約

とかにひっかからないのかなー。こういうことって思う。
mixilaboの件、事務局に問い合わせている人もいるみたいだけど
未だに返答もアナウンスもないらしい。大丈夫か?mixi。

2007/07/26 (Thu) 11:48

&y  

規約

少なくともDB化は禁止されていますよ。

2007/07/26 (Thu) 12:59

タロウ  

個人を特定されると、

なにか都合が悪いことでもあるのでしょうか。

2007/07/26 (Thu) 14:25

名前を名乗れない人  

結局、アカウント使ってログインしているだけじゃないですか。

1000万回人が頑張って見回るのと一緒。

ただ、それをプログラムにさせたということでしょ。

これをミクシィのアカウント持っていない人に公開するのは
アカウントを他人に教えていると同義、規約にひっかかりそうだね。

2007/07/26 (Thu) 14:44

名前を名乗れない人  

所在地と本名がわかると

どうして「非常に危険な状態」なのですか?

2007/07/26 (Thu) 18:34

ビタミン  

色々できるんですね…。

よくSNSで何人突破とかありますけど、実際どうなんでしょうね。
Mixiのアカウントなんて、1人でたくさん持ってる人多いでしょうし…。

2007/07/26 (Thu) 18:36

幸之介  

> 都合が悪いこと

個人特定可能状態であることを本人が認識していれば現実的な危険はないでしょう。しかし特定されると思っていない日記などには都合の悪いものもあるかもしれないね。

とはいえこの記事の煽り調子はどうかと思う。

2007/07/26 (Thu) 19:48

圧力鍋  

「匿名にしていれば安全、実名は危険」というのは一見もっともそうでいて実は無根拠ですね。以前はNetNewsでもWebでも実名を開示して発言するのが当たり前だったのですが、そういう記憶は急速に薄れつつあるのでしょうか。

2007/07/26 (Thu) 21:00

yu  

はじめまして

mixiからこのブログを拝見しました。
皆さんが個人を特定されないことについて、別に問題ないというようなコメントがあるのですが、私はとても嫌なことだと思います。
妹が実名で公開して、嫌な目にあったこともありますので、本当にそう思います。

この記事を見ても私は難しいことはわかりませんが、そういう事が出来るという事がわかっただけでも大変勉強になりました。
ありがとうございます。

2007/07/26 (Thu) 22:39

ひかる  

本名公開はいい場合と悪い場合が

連絡が途絶えてた人と再会できた。なんていい面もあれば、見知らぬ誰かに付けねらわれたなんて悪い面も。
でもこれはネットに限ったことではありませんが、とりわけネットが簡単にかつ大量に個人情報を入手しやすいということでしょうね。
リスクもあるという意識はもっていたほうがいいと思います。あとは自己責任ですね。

2007/07/27 (Fri) 01:18

名前を名乗れない人  

mixi 運営者に連絡しても改善がみられなかったから公開したのでしょうか。

一部ソースコードまで公開し、WEBアプリケーションを組めるPGなら誰でも実装可能な状態にすることがどういうことか、ご存じのはずです。

mixi のプロフィールが取得できるらしいレベルで済ませてほしかったものです。

2007/07/27 (Fri) 09:44

hg  

男性の方は

>所在地と本名がわかると
>どうして「非常に危険な状態」なのですか?

本気で言っているのでしょうか・・

2007/07/27 (Fri) 16:32

マロン  

これはちょっと

怖いですね・・・(つд⊂)

2007/07/28 (Sat) 00:07

G  

できませんよ

やってみたけどできないですね。

嘘ですか?

2007/07/31 (Tue) 00:48

名前を名乗れない人  

完全に消えてないですね

http://mixilabo.com/index.cgi?ln=id&pw=password&fn=login
をすれば、まだ足あとだけ取得できそう。

2007/07/31 (Tue) 13:58

名前を名乗れない人  

だから・・・

そもそも個人情報がどうとかよくも判ってないのに騒ぎすぎな風潮。ぎゃくにいうと閉鎖空間だから許されるとか思うのも平和ぼけ過ぎ。

実名・代替の所在判りましたが何か?

という振る舞いをしていれば良いだけの話し。論点ずれ。

2008/02/07 (Thu) 16:33

Leave a reply

Trackbacks 4

Click to send a trackback(FC2 User)
この記事へのトラックバック
  • 知り合いをmixiに招待する時は、本名での登録とプロフィールを公開しすぎないようにと言ってます。してしまったために えらい目にあった人もいますし・・・今回は関連する記事があったのでブログでも載せてお

    2007.07.26 (Thu) 17:54 | なべもののブログ(パソコン相談所)
  • おはようございます。 いやぁ~~~~アツ━━━━(´Д`υ)━━━━・・・。昨日本格的にクーラーをつけてしまった; title([[]]) mixiのユーザーのプロフィールを外部へ持ち出し、データベース化するシステムは作成可能(これはひどい) 本名書くのはやめようね。というか

    2007.07.27 (Fri) 06:53 | とんかつ3号 隠れ亭
  • mixiのユーザーのプロフィールを外部へ持ち出し、データベース化する ...なぜか? プロフィールはmixiアカウントを持っていない人でも見れるからです。 え?なんて今更聞かないでくださいね。 会員数1000万人突破している

    2007.07.31 (Tue) 14:56 | mixiで遊ぶ!!
  • mixiのユーザーのプロフィールを外部へ持ち出し、データベース化する ...全国のmixiユーザー達。 SNSとは?と聞かれて答えれますか? 閉鎖的?小規模日記? そんなのは昔の話。 そろそろプロフィールに本名を、何も考えずに

    2007.08.07 (Tue) 07:38 | 稼げる情報!ミクシィクエスト2【mixiQuest2】をご紹介!