エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
さっくり調べる。 概要を知る 読む http://ja.wikipedia.org/wiki/全文検索 Ngram(N-gram)とは何か & 形... さっくり調べる。 概要を知る 読む http://ja.wikipedia.org/wiki/全文検索 Ngram(N-gram)とは何か & 形態素解析との比較 メモ 形態素解析: 辞書品質により検索落ちも N-Gram: ノイズ: 京都 -> 東京都庁 インデックスサイズ肥大化 評価指標 recall (再現率): 検索漏れの少なさ precision (適合率): 検索ノイズの少なさ recall と precision はトレードオフ 日本語縛りなら形態素解析 ? Ngram の利点は言語選ばず適用可能なこと 但し原理的に精度が形態素解析に及ばない 検索抜けを回避したい等の明確な理由により検討余地あり 日本語は特殊処理を要する傾向がある 形態素解析の欠点 処理時間 辞書の分割単位と検索漏れ 辞書:マカデミアナッツ クエリ:ナッツ でノーヒット ソリューション Solr ECナビ,