経済プレミアインタビュー フォロー

DeepL創業者「時が熟すのを待っていた」音声翻訳を開始

山口敦雄・経済プレミア編集長
DeepLのヤロスワフ・クテロフスキー最高経営責任者=東京都港区で2024年11月25日、山口敦雄撮影
DeepLのヤロスワフ・クテロフスキー最高経営責任者=東京都港区で2024年11月25日、山口敦雄撮影

 ドイツの人工知能(AI)翻訳サービス会社のDeepLは11月から会話の音声翻訳サービスを開始した。サービス開始時点で日本語、英語、ドイツ語、韓国語など13の言語に対応し、多言語のオンライン会議で利用できる。文章翻訳で定評のある同社にとり、音声翻訳サービスの開始は長年の念願がかなった形だ。同社の創業者のヤロスワフ・クテロフスキー最高経営責任者(CEO)に音声翻訳の可能性について聞いた。

文章より音声翻訳の方が難しい

――音声翻訳サービスの「DeepL Voice」を開始しました。

 ◆多くの社員が開発にかかわり、膨大な作業量の結果、出来上がったサービスだ。とてもうれしく誇りに思う。特にうれしかったことは、実際に使い始めたユーザーからの反応だ。「Voice」が登場したことで、いろいろな会話に深くかかわれるようになったといった喜びの声が来ている。

――AIの文章翻訳では業界をリードしており、音声翻訳への期待値も高いです。

 ◆2017年の創業の前から、音声翻訳の構想はあった。翻訳技術が実践的に音声翻訳に使えるようになるまで時が熟すのを待っていた。おかげ様でユーザーの期待値に沿ったサービスを提供できたと考えている。当社のAI翻訳の品質への期待値が高いことを重々認識しているがためにリリースが、いまのタイミングになった。

――音声翻訳ではグーグルなどライバル企業が先行しています。

 ◆文章を含めて翻訳に特化したサービスを提供している強みがある。文章翻訳と同じように音声翻訳でも「品質」が重要だ。リアルタイムでの音声翻訳は文章翻訳よりも、複雑だ。音声翻訳では、話している内容が不明確だったり、内容が曖昧だったりするので「品質」を担保するには音声の方が文章よりも難しい。また音声は、より翻訳スピードが重要になる。

 もちろん翻訳された内容が正しいことが求められる。リアルタイムで流れるような形で翻訳文が流れ、会話が実現できる。そのような環境を構築するために必要な研究や技術開発を行ってきた。

――実際に利用したユーザーの反応はどうですか。

 ◆あるユーザーから聞いた話では「Voice」を導入する前は、そのチー…

この記事は有料記事です。

残り844文字(全文1742文字)

経済プレミア編集長

 1974年生まれ。明治学院大法学部卒、同大大学院経営学修士。ビジネス誌「週刊エコノミスト」編集部記者、毎日新聞出版図書第二編集部編集長、学芸部記者を経て経済部。経済部ではメガバンク、財界、デジタル庁などを担当。24年1月から現職。著書に「楽天の研究」(毎日新聞社)がある。