注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
んと。よくあるのですが… ・ある項目について、ある程度曖昧に検索をしたい ・複数のタプルに渡る情報か... んと。よくあるのですが… ・ある項目について、ある程度曖昧に検索をしたい ・複数のタプルに渡る情報から検索した(いわゆる全文検索系 なんていう時に。丁寧に作ると、結構すごい事になります。 つまり ・n個のタプルに対して ・それぞれ、そのまま、文字の加工(英数を半角にとか、大文字小文字とか、半角全角のカタカナひらがなとか)を数種類 とかってやってたり。 …すると、DBの中ではものすんごい量の処理が走ります。エコの観点からあまり好ましくありません(ナニカガチガウ…)。 んぢゃどうするか。 まず、DBに「find_string」とかいう怪しい項目を追加します。サイズは可能な限りでっかく。 で、ここに「検索したいタプルの情報を全部足し算してぶち込む」ですが、ここで一工夫。 ・文字列を整頓する です。つまり ・英数の全角は半角に ・英字は全部小文字に ・半角及び全角のカタカナは全角のひらがなに ・検
2009/01/14 リンク