セレクトブクマ公開

自分が作成したWebサービス「セレクトブクマβ版」を公開しました。
http://plazman.chi.mag.keio.ac.jp/sbm/summary.jsp


以下にセレクトブクマの説明を書いていきます。


セレクトブクマは、指定したタグに対して、長い間ブックマークされ続け、かつ、指定されたタグでの被ブックマーク数が多いWebページを検索するサービスです。
はてなブックマークのデータを利用させてもらっています。


ソーシャルブックマークのデータを分析したところ、大まかに分けて次の2種類のタイプのWebページがあることが分かりました。


(1) 急激にブックマーク数が伸びて、その後はほとんどブックマークされなくなるタイプのページ
(2) 長い期間に渡ってブックマークされ続けるページ


また、上記の2種類のタイプのページを分析しました。
その結果、(1)のタイプのページは、ニュース性・話題性・議論性の強いブログなどに多く、
(2)のタイプのページは、有用なWebサービスであったり、よくまとまった技術解説サイトであったり、
何かのまとめサイトなどが多いことが分かりました。


そこで、私は以上のソーシャルブックマークの特性を利用して、タイプ別にWebページを分類するシステムの開発を行っています。


まだ、開発途中の部分もありますが、現状で開発したものは、タグを指定することによって、指定したタグにおいて、長い期間に渡ってブックマークされ続けるタイプのページをあるロジックに基づき、取得するWebサービスです。
実際に動かして見ると、たとえば「Java」というタグを選択して上位10件取得した場合、Googleで「Java」と検索して出てくる上位10件よりも、Javaプログラマーにとっては有益なページが取得できています。
同様に技術的で、ある程度以上有名な1単語検索に関しては、Google検索に勝っているものが多いと考えています。(現時点では、まだ私個人の主観ですが)


また、研究室内で行ったアンケートででは、本システムを利用することにより、5人中5人が何らかの有益なWebページを発見できています。


今後の予定としては、ソーシャルブックマークの時間情報とブクマされるページのタイプをさらに分析し、分類ロジックの改良をしていこうかと考えています。
さらに、他にも作成中のシステムがあります。完成しましたら、また、こちらのブログやtwitter(@wilfue)などで公開していこうと思っています。