Amazon Comprehendで日本語が使えるようになったので社長のブログを分析してみた

記事タイトルとURLをコピーする

こんちくわ。

Amazon Comprehendで日本語が使えるようになりました。

弊社社長の大石のブログの文章をつかってどんな具合か見てみたいと思います。

方法

2019/11/07現在、Amazon Comprehendで日本語がサポートされているのはエンティティ分析・キーフレーズ分析・感情分析になります。

Languages Supported in Amazon Comprehend

今回は2019/10/08に公開された記事『東京2020大会の期間中、2週間お休みを取ります!』の文章に対してこれら3つの分析をAWSマネジメントコンソールから実施しました。

結果

エンティティ分析

以下はマネジメントコンソールから確認できる結果のスクリーンショットになります。27コのエンティティが検出されました。

オリンピック」といった単語がEventとして検出されているがわかります。「東京」がEventだったり「一生」がQuantityだったりと、ん?となるようなエンティティも検出されていますが、そういったものはConfidenceが比較的低いです。

キーフレーズ分析

76のキーフレーズが検出されました。結果のスクリーンショット等は多くなってしまうのでこの記事では割愛します。。。

ドキュメントにも記載がありますがほとんどの修飾語 + 名詞がキーフレーズとして検出されました。

感情分析

さて感情分析です。以下は結果のJSONです。

結果は。。。


{
    "Sentiment": {
        "Sentiment": "NEUTRAL",
        "SentimentScore": {
            "Positive": 0.0011203408939763904,
            "Negative": 0.0008401419036090374,
            "Neutral": 0.9980387091636658,
            "Mixed": 8.876145898284449e-7
        }
    }
}

Neutralが0.99 confidence!!!!!!

最後には『ぜひ皆さんで一緒に、この一生で一度の機会を楽しみましょう!』と述べているものの、たしかに弊社の取り組みを説明しただけの文章ですのでNeutralというのは納得できます。

まとめ

いかがでしたでしょうか、

Comprehendが日本語に対応したということで、社内のコミュニケーションツールに投稿される内容やお客様とのメールとのやり取り・お問合せ対応の内容等の分析にも使えそうです。

"; doc.innerHTML = entry_notice + doc.innerHTML; }
' } }) e.innerHTML = codeBlock; });