注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
第 4 章 SUFFIX ARRAY によるコーパスの類似検索 4.1. する。 Suffix Array 本節では、本論文で多用してい... 第 4 章 SUFFIX ARRAY によるコーパスの類似検索 4.1. する。 Suffix Array 本節では、本論文で多用している Suffix Array という検索用データ構造について解説 Suffix Array とは高速な文字列検索を可能にするデータ構造である。UNIX の grep コ マンドのような「テキストに対するあらゆる部分文字列の検索」を高速1 に行なうこと ができる。ただし、あらかじめ検索用インデックス ( = Suffix Array) を作成しておく必 要がある。 Suffix Array の特徴を簡単にまとめておく。 • どんな部分文字列でも検索可能。日本語テキストへのインデクシングで、形態素解 析などの単語分割処理が必要無い。 • しくみが単純なので実装が簡単。 • 検索時に必ず元テキストが必要。WWW サーチエンジンには不向き。サイト内検 索ならば問題無い。 •
2009/05/26 リンク