第五十一回 最近は研究が忙しいのと,RailsをせっかくさわってるんだからBlogもRailsアプリにするべきじゃない?という短絡的な思考でtypoでBlogを作ってみました. acts_as_ludia や,acts_as_find_or_initialize_by といったプラグインのこともちょこっと書いてます. 私自身が非常に飽きっぽいのでいつまで続くか分かりませんが,お時間があればのぞいてあげてください. 新しく作ったBlogはもちろんtypoがベースになっていますが,実はRuby-GetText-Packageを利用して日本語化しようと目論んでいたりします.設定画面の一部などが今は日本語になってきています.その話もおいおい. typoベースの私のブログ http://blog.fulltext-search.biz/ 第五十回 [myname@localhost wikipedi
今週やってくることの一つとして、学習データを作成して実際にSVMで学習させてみる、というのがある。 そのためのソフトウェアとしてMeCabを利用する。 また、TermExtract という単語(名詞)に対する重み付けを行うためのPerlモジュールを利用する。 MeCabは形態素解析を行うソフトウェア。 TermExtractはMeCabやChaSenなどの処理結果から語句の重要度(TF・IDFなど)を計算する。 まずはMeCabのインストール ソースの入手先:http://mecab.sourceforge.net/src % ./configure --with-charset=utf8 % make % su # make install MeCab用の辞書も同様の手順でインストール 今回はIPA辞書を使うことにする ソースの入手先:http://mecab.sourceforge.
TermExtractを使ってキーワード抽出 トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン カテゴリ[Perl] TermExtractのMecabモジュールでキーワード抽出を行う。 まずはMecabのテキストを作る。 use MeCab; my $text = "私はももが好きです。"; my $mtext = getMecabText($text); sub getMecabText{ my ($text) = shift @_; my @arg = ($0,"Ochasen"); my $mecab = new MeCab::Tagger(\@arg); my $exdata = new TermExtract::MeCab; $text = $mecab->parse($text); return $text; } うんでTemrmExtract::Mecab
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く
{{#tags}}- {{label}}
{{/tags}}