注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
こんにちは。CTOの永井(shnagai)です。 この記事はコネヒト & コネヒト生成AI Advent Calendar 2024 の8... こんにちは。CTOの永井(shnagai)です。 この記事はコネヒト & コネヒト生成AI Advent Calendar 2024 の8日目の記事です。 adventar.org 今日は、LLMを使って形態素解析処理をいかに楽に出来るかを実験したので、その内容について書いていきたいと思います。 やりたいこと・モチベーション 社内の盛り上げツールとして、ワードクラウドを作りたい ワードクラウドは文章の特長を捉えているとよりうれしい 一般的なワードは省きたい Pythonを使う フリーテキストなので形態素解析が必要だが、テンポラリな処理なので辞書等はない できるだけ楽して作りたい(一番大事なモチベーション) 形態素解析する時につらい処理 形態素解析をする時に一番気を遣う部分が不要な単語をいかに削り意味のある文字を残せるかという部分です。 例えば、これまでだとPythonで形態素解析をするとき
2024/12/08 リンク