長文を3行ぐらいで纏めてくれるChrome拡張 IMAKITA on Chromeを作ってみました

半年ぐらい前にGigazineデビューした文章要約エンジンIMAKITAが遂にChrome拡張になって帰ってきました。

 

chrome.google.com

 

唐突ですが皆様は偉い人の長話に苛々したことはないでしょうか。言いたいことは短いのに枝葉をつけた長文を送られるのにウンザリしたことはないでしょうか。

 

そんな皆様の声(?)を受けて、半年前に長文を3行ぐらいで纏めてくれる(厳密には、文章全体の中で特に重要度の高い文を抽出してくれる)エンジン IMAKITAを作ってみました。

https://www.qhapaq.org/imakita/

 

IMAKITAは私の想像以上に好評であり、なんとGigazineにも掲載してもらえました。そして、多くのユーザから「ハイライト機能が欲しい」「逐一サイトにデータを貼り付けるのが大変だ」というアドバイスをいただきました。

 

そこで、IMAKITAをブラウザ用のアプリにすることにしました。使い方は至ってシンプル。テキストを選択して右クリックからIMAKITAを呼び出すだけ。簡単!!

 

【使用例】

ニコニコニュースを参考に、いかがでしたかブログの王道である「綾瀬はるか 恋人」で検索し最初に出たページを圧縮してみました。要約する行数は7行、各々の要約文の長さは10文字以上になるように設定した結果が以下のとおりです。

 

----------

綾瀬はるかの本名や年収は?熱愛中彼氏と結婚?髪型がかわいい – ロバ耳日誌 https://robamimireport.com/ayaseharuka-honnmyou/
綾瀬はるかの本名は?
綾瀬はるかさんの本名は蓼丸綾というみたいですよ.
読み方は「たでまる あや」です.
綾瀬はるかの年収はどのくらい?
綾瀬はるかさんはほぼ毎日テレビに出ていますよね.
CM1本あたりのギャラは4500万円ですから、CMだけで7億2000万円ですよ!
 
 
ドラマや映画にも出ていますから、10億円を超えていると考えられますね.
ちょっと綾瀬はるかさんの髪型画像を集めてみました.
綾瀬はるかさんは前髪を常に短く作るのが特徴ですよね.
童顔の人が真似すると幼くなりすぎてしまうので注意が必要です.

---------

 

本名と推定年収と髪型に関する要約が綺麗に抽出出来ました。彼氏については結論が出ていなかったからかAI様は完全にスキップしてしまいました。

 

【機能について補足】

生成された要約はクリップボードに自動的にコピーすることが出来ます。キュレーションサイトを圧縮して呟くという賽の河原遊びも楽々出来ることでしょう。

 

要約分に対応する文字をハイライトする機能も実装していますが、jqueryの仕様なのかhtmlタグが入っていると上手く機能しません。解決方法知ってる人教えてください><

 

また、本家IMAKITA同様、多言語にも対応しています。英語、フランス語、スペイン語、ドイツ語に対してもテキストから原語を自動で推定し、要約を生成してくれます。

 

形態素解析(文章の単語を区切る機能)の精度が悪いため、恐らく本家に比べると精度がやや劣ります。

 

【ソースコートと論文】

IMAKITA on Chromeはgithubでコードを公開しています。また、技術的解説文書もアップされています(日本語版の解説記事も書く予定ですが予定は未定ですorz)。