やじうまの杜

青空文庫を全文検索できる「Aozorasearch」が話題に ~「文明の発展に貢献できるレベル」

作者や年代、ジャンルで絞り込むこともできる

 「やじうまの杜」では、ニュース・レビューにこだわらない幅広い話題をお伝えします。

青空文庫を全文検索できる「Aozorasearch」

 青空文庫を全文検索できる「Aozorasearch」というWebサイトが、「Twitter」で話題になっています。なんで今まで内緒にしていたんですか!

 知らない方のために軽く説明すると、「青空文庫」は著作権切れになった作品を書き起こし、まとめている電子図書館です。利用は無料で、過去の名作が読み切れないほど収録されています。

 「Aozorasearch」は以前から存在するようで、筆者は寡聞にして知りませんでしたが、「青空文庫 Advent Calendar 2017」でも紹介されていました。開発者であるMasafumi Yokoyama氏(@myokoym)の「Qiita」記事によると、内部は「Ruby」や「Sinatra」(Ruby製のWebアプリケーションフレームワーク)、全文検索エンジン「Groonga」などで構成されており、データは「GitHub」に保管されている「青空文庫」のデータが活用されているとのこと。

 「青空文庫」にもGoogleやBingを利用した検索機能が備わっていますが、キーワードで検索してもそれが載っている作品ぐらいしかわかりません。その点、「Aozorasearch」ならばキーワードが出現した箇所までわかって便利。フワッとした記憶から正確な出典や表現を調べるときなどにはもちろん、なんなら作者や年代、ジャンルで絞り込むこともできるので、

「なんか知らんけど、『虎』の出てくる小説が読みたい気分だなぁ(「Aozorasearch」で検索」
「いっぱいあるな……中島敦のヤツにしよう(作者名でフィルタリング」

ってな感じに、読みたい本をゆるーく探すときにも役立ちます。「虎が出てくる中島敦作品は『山月記』だけじゃないのか!」なんて新しい発見もありますよ!

「虎」で検索。右側にはジャンルや年代、作者でフィルタリングするためのリンクがずらり
作者名でフィルタリングした様子

 ただし、「Aozorasearch」はちゃんとキーワードがマッチしないと探せません。たとえば「邪 暴虐」では『走れメロス』は見つけ出せず、「邪 暴虐」と入力しないといけません。Google検索ならばその程度の表記ゆれはマッチさせてくれるので適所適材、双方を使い分けるのがいいのかなと思います。