最近は3dとか物理エンジンとか、グラフィックっぽいことばかりだったので、
少し違うことを。
JavaScript で形態素解析もどき
このあたりを参考に形態素解析もどきで遊んでみます。
まずは、参考サイトのように、日本語の文章を、漢字やひらがな、カタカナで分割してみます。
と、言ってもほんの2行ですね。
var pattern:RegExp = /([一-龠々〆ヵヶ]+)|([ぁ-んー-―]+)|([ァ-ヴー-―]+)|([a-zA-ZazA-Z]+)|([0-90-9.]+)|[、。!!??()()「」『』-]/g; output_text = input_text.match(pattern).join(" | ");
正規表現で分割して、とりあえず今回は「|」で区切ってみました。
ちなみに文章のサンプルはWikipediaからActionscriptの項です。
「原文」のテキストエリアに文章を入れて、「解析」ボタンを押すと文章をパースします。
今日はここまで。