彼氏が LIKE 検索使ってた。別れたい… (もしくは Solr 入門とか Tritonn のインクリメンタルバックアップとか)

LIKE 検索だとデータ増えてきた時なんか恥ずかしいwww
下向いちゃうしww
男にはせめて全文検索エンジン使ってほしい・・・
検索が遅すぎてユーザー帰っちゃったら・・・・もう最悪www
せめて普通 Tritonn や Solr くらいは使って欲しい。
常識的に考えて欲しいだけなんです!
「%」検索されて全件マッチしちゃった時の恥ずかしさとか分かる?
あのね?たとえば1年間で10万件とか文書がたまるでしょ?
それを格納して検索するわけじゃない?
みんな普通に形態素解析とかn-gramとか期待してるわけでしょ?
LIKE検索でタイムアウトしてたら大恥かくでしょうがww

とまあ、検索するなら全文検索エンジン使うしかないわけですが。じゃあ何を使うべきか。

自分は、ながらく Senna をベースにした MySQL の全文検索拡張 Tritonn のユーザーで、自分で機能追加のパッチも書いたりしているので、他のものは面倒くさくて評価する気がありませんでした。

でも、そんな自分でも気になるくらい Solr の名前を聞くことが多くなってきたように思います。そんな折に技術評論社さんよりいただいたのが「オープンソース全文検索エンジン Apache Solr入門」。ありがとうございます!

Apache Solr入門 ―オープンソース全文検索エンジン

さくさくっと読めて、Solr の使い方の勘所がわかります。これなら自分のようなモノグサでも、Solr を使えます。いや、きっと使う。いや、ひょっとしたら使うかもしれない...

「うそはうそであると見抜ける人でないと難しい」という 2ch を評した言葉がありますが、Google で調べようと思っても、信頼性の高い、まとまった情報にたどり着くのは難しいです。それが特に、自分の良く知らない製品や分野ならば、なおさらです。

「Apache Solr入門」は、全文検索エンジンを使いたい開発者にとっては、必読書だと思いました。

ほんとは Tritonn と Solr の比較でも書こうと思ってたんですが、時間がないのがこのへんで。明日 hbstudy#8 で話す準備をしないと。

InnoDB と Tritonn の、一貫性のある、増分バックアップをどうやって取っているか、なんていう話も出ると思うので、興味のある方はご参加いただければと思います。

PS. Solr の疑問点について書いた: Solr って、書き込みの Disk I/O が多くて、リアルタイム検索は不可能なのかしら - kazuhoのメモ置き場

参考: 書籍「Apache Solr入門」 | 関口宏司のLuceneブログ