夏目漱石・芥川龍之介・宮沢賢治・太宰治・江戸川乱歩の作品からTFの特徴量をSVMに入れて分類分けしてみた
SVM(サポートベクターマシン:教師あり学習)を使った課題の第二弾があったのでまたまた、processingで分析して遊んでました。
前回↓
matatsuna.hatenablog.com
結果
94.4%でした!!
これは完全にSVMで分類分けできます。
考察
間違えてしまった作品は太宰治の「緒方氏を殺した者」を江戸川乱歩と判断してました。中身を読んでみるとかなり暗い内容になってました。確かに江戸川乱歩っぽい作品です。これは、納得してしまいました。
今後の展望
たくさんの作品を入れると文章に用いる単語の似た傾向を出すことができるかな~って思ってます。