ふたたびまどろみのなかで

原口昇平のブログ

懸念――機械翻訳エンジンの開発における搾取的なデータ利用の可能性

AI翻訳ツールを提供する独DeepLは7月3日、日本法人DeepLJapanを設立したと発表しました。

私は、機械翻訳エンジンの開発において搾取的なデータ利用がなされている可能性を、深刻に懸念しています。

例えば、DeepLの機械学習に使用されたLingueeをみてみましょう。これはもともと、複数の言語で同じ内容を公開しているウェブサイトやオンライン文書から文を抽出し、一対一で対応させる処理(「アラインメント」)を行って構築されたようです。実際に何か単語を検索し、表示される文の出典URLをクリックするとそれを確認できます。

困ったことにこのような著作物の利用は2018年、安倍政権時代に著作権法に加えられた世界的に類を見ないらしい改正(下の画像)により既に本邦では合法とされます。おかげで日本はAI天国とみなされており、ChatGPTで知られるOpenAI社からも先日CEOが来日して自民党の会合に出席するなど進出の気配をみせています。にもかかわらず、翻訳者たちやウェブサイト・文書の所有者たちにどのように報酬を支払うかはまともに議論されていません。

著作権法第三十条の四

さらに困ったことに、この手法ではほとんどあらゆる出版物の電子データを利用することができてしまうのです。そして理論的には、少なくとも10万ユニットほどの文を揃えられる分量の原書と訳書の電子データを用意し、作業者を多数、短期間雇用してアラインメントをさせれば、機械翻訳エンジン開発に不可欠な要素のひとつである言語データベースは完成します。この手法は、いくつかの翻訳会社大手がすでに取り組んでいるような、企業として所有するTM(Translation Memory:原文と新たに作成した訳文をペアで格納するデータベース)をもとに機械翻訳エンジンを作り上げる手法に比べて、はるかに大量のデータを取り扱い、はるかに広範囲の分野に対応することが、資金の続く限りできてしまいます。そして資金は、機械翻訳が喧伝されればされるほど集まってくるのです。

こうしてTMばかりでなく、TM/CATツールを使わないので安全圏内だと思われていた翻訳書などの出版物までもが、機械翻訳エンジンの開発に利用されるようになるとは、産業翻訳者のみならず出版翻訳者もまた、多くの人が少なくとも10年前にはまさか予想もしておらず、今も決して積極的に同意できないでしょう。

そろそろこの動きをみんなで食い止めませんか。私は翻訳者の皆さんにみっつのことを提案します。

  1. 産業翻訳会社に対し、MTPE(機械翻訳+人間編集)案件を引き受けないか、受けるとしてもHT(人間翻訳)以上の単価で引き受けると表明する。
  2. 出版社に対し、機械翻訳エンジンや生成AIの開発に出版物が利用されることに反対する姿勢をとるよう訴える。
  3. 国に対し、著作権法の再改正を求めていくと同時に、AI所有者が第三者により作成または所有されているデータを機械学習に使用して構築したあらゆるAIに高額の税をかけ、徴収した税金を福祉のためだけに使うよう求めていく。こうして翻訳者は直接利益を受け取れなくとも間接的に国民全員とともに利益を受け取ることができる。

業界団体に一切加入していない私にとっては、これを組織的に実行するにはどうすれば最もよいかがまだ分かっていません。労働組合の結成が必要になりそうな気もしていますが、他の既存団体で現在の流れを食い止める力をもつ方々がいるなら、ぜひご自身のためにも行動をお願いいたします。
私はこれらの提案事項が私のものであるなどと主張しません。実行に移す方がひとりもいなくとも私は今後もさまざまな機会にこの提案をシェアし続けていきますが、もしも実際に動いてくださる方がいるならどうぞご自分のイニシアチブとして提案していってください。

 

なお、複数の多言語大手で正社員として働いた中で、翻訳か校閲にたずさわる部門では、MTPE(機械翻訳+人間編集)に積極的に賛成する社員に私は出会ったことがありません。管理職でさえ上に命令されているのでというエクスキューズをつけていました。

ただ企業として競争優位性を失わないためにMT進化の流れについていかねばならないという経営判断があり、同時にクライアント側のコストカットの強いニーズから説明を重ねてもMTPEが選択されるケースが相次いでいました。

言うまでもなく、翻訳会社の社員たちは業界の破滅を望んでいません。AIが引き起こすであろうdisruptionについては、誰かにどこかで止めてほしいと思っているか、少なくとももっと害のないものに変わってほしいと願っているはずなのです。しかし内部からそのアクションを起こすことは当然ながら困難です。ならば、私たちが止めましょう。