Torisugariの日記: プライバシーと安全性 10
昨日付けでWebサービスのインターフェイスを日本語化する「Japanize」というFirefoxの拡張に関する記事がslashdot.jpに掲載されています。この拡張の中身をざっと覗いてみたのですが、気になる点がいくつかありました。
そのうちの一つ、プライバシーについて、です。
まず、仕様許諾の第七条に
7. お客様の情報の取り扱い
本ソフトウエアの機能を利用する場合、ブラウザに表示したページのホスト名をサイボウズ・ラボのサーバーに送信する必要があります。但し、送信されたホスト名については、サイボウズ・ラボでその情報を記録することはなく、その情報を保存・解析したり、第三者に販売することもありません。
とあります。
どういうことか簡単に説明すると、この拡張はDOMContentLoadedイベントの際、翻訳データの有無をサーバー(japanize.31tools.com)に
http://japanize.31tools.com/data/www.example.com/current.txt
という形式で問い合わせます。そして、このリクエストは対応しているサイトだけでなく、全てのドメインについて行われるのです。つまり、これは利用者の履歴(ドメインのみ)をリアルタイムで公開しているのと、全く同じ状態です。気になる人は、about:cacheでどのようなURLにアクセスしているのか確かめてみるとよいでしょう。
端的に言うと、これはれっきとしたスパイウェアなのです。しかし、利用規約にその情報の悪用はおろか、記録すらしない、と明記してあります。上の第七条はそういう意味だったのです。
ここまでで、大体の状況は掴めたでしょうか?
さて、問題は「ブラウザに表示したページのホスト名をサイボウズ・ラボのサーバーに送信する必要があります」という部分です。これが事実なら仕方がないのですが、私にはそうは思えません。無論、翻訳を実行中のサイトに関して情報をやり取りするのは当然のことですが、全てのサイトが対象というのは、いくらなんでもやりすぎです。そもそも、翻訳対象は極めて少数(ブログによると、現在35サイト)なのですから、翻訳可能かどうかをローカルで吟味して、必要な時だけ情報を取りに行く、というモデルも成り立つはずです。
なぜこういう仕様なのかについて、性急な結論は避けたいと思いますが、こういうソフトウェアが実在しているのは非常に興味深いです。あれこれ考えてしまいますよね。
一般化すると
- 利用規約について、利用者の理解度
- プライバシーとサービス提供者の倫理
- クライアントアプリケーションとサーバーサイドアプリケーションの技術の偏り
- ベータステージにおけるソフトウェアの公開
という感じのトピックなんか良さそうです。
機会があれば、気になったもう一つの点、安全性についても、少しメモを残しておきたいと思います。
既にサーバーから消去済み (スコア:1)
同じことだけど、参考のこと。
Re:既にサーバーから消去済み (スコア:1)
これは推測ですが、Japanizeの著者は、CGIのプロで、Mozilla関連の開発経験がほとんどゼロです。まあ、当り前ですけど、どう考えたって、拡張を書く技能は潰しがきかないので、そういう人はゴマンといるでしょう。
それで、どういうことが起こったかというと、本来拡張でやるべき処理をサーバーサイドに投げてしまったのではないでしょうか。だから、要りもしないプライバシー情報を無駄に収集しては、捨てているのです。言うなれば、「利用者のプライバシー」と「開発のしやすさ」がトレードオフされてしまった、とでも。
しかし、これは一概に悪いとは言えませんよね。Googleなんかは、全て分かった上で、利用者を納得させて、意図的に情報を収集しています。一方で、こちらは開発コストを下げる為に仕方なく(?)情報を収集しているわけで、開発が進めば、開発者と利用者の双方にとって不本意な状況が改善される見込みが十分あるわけですから。存在しないソフトウェアは利用できないわけでして、初めて書いた拡張をとにかく動くレベルまで持ってきたことは、評価できると思います。その上で、採算がとれるラインまで持ってこれたら言うことなしですね。
セキュリティ関連の話題は次のバージョンアップまで待ちますけれど、そういった点も含めて、発展途上であるのを強く感じます。個人的に、ちょっと公開が早すぎたと思うのですが、公開後に得たであろうフィードバックの有意さを鑑みると、あながち悪くもなかった(というか、狙い通り)とも解釈できます。
ま、ここまでは仮定の上の議論なんですけど、改良の余地を大量に残しているのは事実なので、なんというか、少しくらいダメな箇所があっても許してもらえるような、好感度のようなもの、を獲得/維持できるかが、焦点かなあ、と。
----
先に挙げた
の下半分がこんな感じですね。
Re:既にサーバーから消去済み (スコア:1)
全然違います。「奥一穂」で調べれば出てきますが、彼は東大時代にPalm用のウェブブラウザを作っていて、それが元でMITに顕彰されています。また、先日はMozilla Firefoxの脆弱性報告も行っています。
http://www.mozilla.org/security/announce/2006/mfsa2006-33.html
CGIどころか、ウェブブラウザの開発に関しては、よっぽど腕のあるひとです。彼にしてみれば、この程度、おちゃのこさいさいでしょう。
なんでサーバーサイドかというと、そっちの方が誰もが共有できるからでしょう。
...っていうか、この程度、スパイウェアって言うのか?
Re:既にサーバーから消去済み (スコア:1)
いえ、違いません。mfsa2006-32とそのバグをもう一度見てみてはどうですか?そもそも、「経験がない」というのは製品の杜撰さに対する擁護なので、そこを崩されると困ってしまいます。「推測」と断っておきましが、まあ、スクリプトは経歴より多弁ですよ。
> なんでサーバーサイドかというと、そっちの方が誰もが共有できるからでしょう。
意味が全くわかりません。具体的に何の共有のことを指しているのでしょうか?私の説明が悪かったのなら申し訳ないですが、前提に誤解があるようですね。
>...っていうか、この程度、スパイウェアって言うのか?
私は別に言葉にこだわりはないので、取り消してもいいです。が、スパイウェアと表現した方が問題が明確でわかりやすいでしょう。私は別に、なんでもかんでもスパイウェアにしたいわけではありません。日記に書いたような冗長な動作の問題点について、拡張をインストールした人が100%理解しているわけでもないだろうな、と思ったまでです。
ウェブページの閲覧は、本来は自分と相手以外の第三者は知りえない行為です。その情報価値をソフトウェア開発者の方から不当に安く見積もれば、要らぬ誤解を生むもとになります。この挙動が仮に世間的に真っ白な行為だとしても、その誤解だけは残ってしまいますから。そして、それは、私の理解によれば、本来不必要なもの、単純に技術・手間の不足に起因している誤解なのです。
Re:既にサーバーから消去済み (スコア:1)
Japanizeの日本語化のデータです。それ以外の何を? 同じページの翻訳を一々自分で用意するなんて(インストールでも良いけど)、そんな手間のかかる行為は無意味です。
> 私は別に言葉にこだわりはないので、取り消してもいいです。
じゃあ、取り消してください。どこぞの人みたいに過剰反応するこ人がいますので。もう少し言葉は慎重に選ぶべきでしたね。
> ウェブページの閲覧は、本来は自分と相手以外の第三者は知りえない行為です。
ISPはログをもってないんですっけ? リファラは? この前提に大きな無理があります。
Re:既にサーバーから消去済み (スコア:1)
ISP が何でもかんでもログ持ってる訳じゃありません。特に Web アクセスに関しては、普通はユーザの同意の下、ユーザが HTTP Proxy サービスを利用している場合くらいじゃないですか?
# リファラは別の話なのでノーコメント
This is a test message :-)
Re:既にサーバーから消去済み (スコア:0)
と書いています。これをわざわざ説明させるとは、あなたも罪な人ですが、つまり、翻訳データをサーバーとやり取りする点については、我々は既に合意しているのです。いまさら共有のメリットを私に説かれても、相槌をうつしかありません。「理解できない」というのは、なぜ今更その話を蒸し返すのかわからなかったので、とりあえずそう書いたまでで、実際にはあなたの勘違いを確信していました。
Re:既にサーバーから消去済み (スコア:0)
> ISPはログをもってないんですっけ?
ISPだってどこを見に行っているかなんていうログはとっていませんよ。
また、ISPがそのようなログをとろうと思えば可能なように技術が構成されているのは、ISPなんだから必然的にそうなるのであって避けようがありませんね。なにしろ通信インフラの大元なのですから。
そして、ISPは電気通信事業者でなければやってはいけないことになっています。半ば公的事業者として国に管理されています。憲法で定められた通信の秘密を守るために電気通信事業法によって、それら公的な通信事業に縛りをかけています。だから、ISPは保存する情報を最小限にすることが求められますし、その扱いに対して刑事的責任を負います。
対して、アプリケーションサービス提供事業者にはそうした法的な縛りがありません。だからこそ、こうやって私たち市民が監視をして、何が非常識なのかというコンセンサスを作っていく必要があるのです。
Re:既にサーバーから消去済み (スコア:0)
Re:既にサーバーから消去済み (スコア:0)
という認識なんでけど違ったっけ。