エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
gensimの使い方がよく分からないからgensim0.8.6のチュートリアルをやってみた。そのメモ。 「Corpora a... gensimの使い方がよく分からないからgensim0.8.6のチュートリアルをやってみた。そのメモ。 「Corpora and Vector Spaces」のチュートリアルをやってみました。 大事なことだけ最初に書いときます ものすごくざっくり書きます。 下記の意味がなんとなく分かっていれば、gensimのさらに高度な機能(tfidf、LSA、LDA)を理解するのが簡単になります。 dictionary 最初に用意した大きな文章データから各単語の出現回数を計算しておいたもの。テキスト形式で保存して中身を見ればすぐ意味が分かると思います。 コーパス = *.mmファイル(Matrix Marketファイル) dictionaryを元にして、解析したい文章を変換したもの。コーパスを見れば、解析したい文章にどの単語が何回出現するのかが分かります。 両方ともこの後にでてきます。 文字列からベクト