DeepL創業者「時が熟すのを待っていた」音声翻訳を開始

2025年1月4日

保存保存
文字
印刷

DeepLのヤロスワフ・クテロフスキー最高経営責任者＝東京都港区で2024年11月25日、山口敦雄撮影

　ドイツの人工知能（AI）翻訳サービス会社のDeepLは11月から会話の音声翻訳サービスを開始した。サービス開始時点で日本語、英語、ドイツ語、韓国語など13の言語に対応し、多言語のオンライン会議で利用できる。文章翻訳で定評のある同社にとり、音声翻訳サービスの開始は長年の念願がかなった形だ。同社の創業者のヤロスワフ・クテロフスキー最高経営責任者（CEO）に音声翻訳の可能性について聞いた。

文章より音声翻訳の方が難しい

――音声翻訳サービスの「DeepL Voice」を開始しました。

　◆多くの社員が開発にかかわり、膨大な作業量の結果、出来上がったサービスだ。とてもうれしく誇りに思う。特にうれしかったことは、実際に使い始めたユーザーからの反応だ。「Voice」が登場したことで、いろいろな会話に深くかかわれるようになったといった喜びの声が来ている。

――AIの文章翻訳では業界をリードしており、音声翻訳への期待値も高いです。

　◆2017年の創業の前から、音声翻訳の構想はあった。翻訳技術が実践的に音声翻訳に使えるようになるまで時が熟すのを待っていた。おかげ様でユーザーの期待値に沿ったサービスを提供できたと考えている。当社のAI翻訳の品質への期待値が高いことを重々認識しているがためにリリースが、いまのタイミングになった。

――音声翻訳ではグーグルなどライバル企業が先行しています。

　◆文章を含めて翻訳に特化したサービスを提供している強みがある。文章翻訳と同じように音声翻訳でも「品質」が重要だ。リアルタイムでの音声翻訳は文章翻訳よりも、複雑だ。音声翻訳では、話している内容が不明確だったり、内容が曖昧だったりするので「品質」を担保するには音声の方が文章よりも難しい。また音声は、より翻訳スピードが重要になる。

　もちろん翻訳された内容が正しいことが求められる。リアルタイムで流れるような形で翻訳文が流れ、会話が実現できる。そのような環境を構築するために必要な研究や技術開発を行ってきた。

――実際に利用したユーザーの反応はどうですか。

　◆あるユーザーから聞いた話では「Voice」を導入する前は、そのチー…