この記事の内容 Pythonで形態素解析器の比較ができるパッケージ作りました。 Python2.7, Python3.xで動作します。 4つの形態素解析器をサポートしてます pipでインストールできます。 pip install JapaneseTokenizer パッケージのURL ただしWindowsはダメです。ごめんなさいね。 パッケージの特徴 単語分割するための簡単なインターフェース提供 「単語分割 -> ストップワードと品詞でフィルタリング」の操作が1行で完結 Mecab, Juman, Juman++, Kyteaの4種類を同じインターフェースで呼び出し可能 実務でバリバリ使える 株式会社インサイトテックの至るところで1年間半以上、使われてます。 数百万件のテキストでも割とバリバリと処理してくれます 実は本家のpyknp(v0.3)よりも動作が早い 辞書追加の簡単なインターフェ