異なるストアの電子書籍をまとめて管理するためのたった一つの方法

答え:人力

 

さて、iPadの登場以来、日本でも何度目かの電子書籍ブームがやって来ました。
今回のブームはかつてのそれと違って、一社(ないしは1グループ)の提供じゃなくて、複数のサービスが百花繚乱に咲き乱れてるのが特徴でしょうか。

有名どころはグローバルなAmazon, Apple, koboあたりかと思いますが、国内でも 結構な数のストアが出ています。

個人的には、角川提供でラノベ/コミックに強いBOOK☆WALKERと老舗でラインナップも豊富なeBook Japanをよく使っています。他にもパブリやYahoo Book Store, Fujisanなどなど上げていくとキリがない感じです。

 

まあ、コンテンツがないことには始まらないので数があるのは良いことです。でも、現在の致命的な問題として各ストアの電子書籍には互換性どころか同一性がない。

どういう事かというと、eBookJapanとBOOK☆WALKERで同じ本たとえば「そらのおとしもの13」があるわけだけど、これは現在のサービス上、別な本として扱われます。これは紙の本では無いことです。楽天で買おうがAmazonで買おうが同じ本なら同じISBNが付いていて同じ本として扱えます。けど、電子書籍はそれができない不便。

 

具体的に何に困るかというと、レビューの集約とか各ストアのラインナップの計測とかに困ります。eBookJapanとBOOK☆WALKERにある「そらのおとしもの13」はそれぞれ別の本なのでレビューサイトとかもすごく作り辛い。これは不便ということで、e-NDEXに複数のストアの本でも同じ本なら一つのページで管理するという機能をつけました。

 

というわけで前置きがやたら長くなりましたが、新機能リリースですー。

e-NDEX とある電子の書籍検索


例えばこんな感じで eBookJapanとBOOK☆WALKERの「そらのおとしもの13」を一つのページに集約しています。

仕組みとしては、タイトルと著者を分解して楽天ブックスAPIに投げて、それでヒットした最上位に来るもののISBNを取得し、同じISBNになる本は同じ本として扱っています。見つからない本はそれぞれ個別の本として扱う感じです。

 

最初は楽天ブックスよりもヒット率の高いAmazon先生のAPIを使ってたのですが、どうもAPIだとソート順が売上順とかタイトル順しか選べなくて、キーワードから最もマッチするもの、じゃないんですよね。タイトルの類似度比較とかして、頑張ってみたんですが、誤爆しまくりなので、楽天ブックスを使った次第。こいつはヒット率が悪い代わりに誤爆率も低いので、今回みたいな用途には向いてますね。ただ、登録されているデータが微妙 & ローマ数字や記号が混じると基本お手上げという素敵仕様なので、データが溜まったらちょっと分析して変換処理かけて精度を上げたいと思います。

 

で、最初の答えに戻るわけですが、楽天ブックスAPIの微妙なヒット率というか、世の中の書籍の情報が正規化されてないせいで、完全に自動化するのはムリぽです。なので、手動でISBNを入れる機能もつけましたw 最後は人力だぜー。このやり方をソーシャルインデックスと勝手に命名しました。我ながら何がソーシャルなんだろう...

 

自動解析 + 人力でWikipediaみたいな感じで電子書籍のインデックスが作ればいいなぁ、と夢見てます。そして、いろんなサイトから参照できるようにAPI化したりとか。なんか、ゴロでどっかの魔術なインなんとかさんみたいなサービス名にしたんですが、図らずとも関連性が出てきました>< 目標は10万3000冊をいい感じにインデックス!