ニュース

NTTが大規模言語モデル「tsuzumi」、軽量&日本語に強い――商用化は24年3月予定

 NTT(持株)は、軽量かつ世界トップレベルの日本語処理性能を持つという大規模言語モデル(LLM)「tsuzumi」について、2024年3月に商用サービスとして提供を開始する。法人への提供を想定しているという。

 tsuzumiは、11月14日~17日に開催予定の「NTT R&D FORUM 2023 — IOWN ACCELERATION」で展示される。

 近年では、米OpenAIの「ChatGPT」などのLLMが注目されているが、膨大な知識をモデル内に有することで高い言語処理性能を示す一方、学習に要するエネルギー量や運用コストなどが課題とされている。こうした課題を解決すべく、tsuzumiが開発された。

 2023年10月から先行して、京都大学医学部附属病院や東京海上日動火災保険などのパートナーとトライアルが始まっている。

 パラメーターサイズが6億の超軽量版と、70億の軽量版が用意される。NTT(持株)では、OpenAIの「GPT-3」の1750億パラメーターと比べ、およそ約1/300(超軽量版)および1/25(軽量版)と軽量であるとアピール。また、学習コストや推論コストも抑えられるとしている。

 tsuzumiは日本語と英語に対応し、特に日本語処理性能に優れる。生成AI向けのベンチマークである「Rakuda」では、GPT-3.5や、国産でトップとされるLLM群を上回ることが確認されたという。

 今後はマルチモーダルへの対応も予定される。また、サイバーセキュリティ分野への応用なども図られる。