まず、機械翻訳の研究の世界では、どのようなことが起こっているのか、教えてください。
隅田英一郎・NICTフェロー(以下、隅田):今、AI(人工知能)の時代ということで、自動翻訳の世界でもニューラルネットワークを使うのが主流になっています。人間の脳の働きを機械に置き換える、深層学習とも言われるものですね。例えば、日本語で「あ、い、う」と言ったら、英語で「A、B、C」になりますよといった翻訳例文をどんどん覚えてさせていくと、少しずつ賢くなっていきます
(関連記事:深層学習AIで自動翻訳にパラダイムシフト)
覚えさせる例文が多ければ多いほど、正確に訳せるようになるというわけですね。
隅田:そうです。こんな単純な仕組みで、どうして翻訳が上手くいくのか不思議に思われるかもしれませんが、この仕組みで翻訳精度が飛躍的に向上しています。
例えば、次のような日本語の文章を従来の方法で翻訳すると、いかにも機械が翻訳したような感じの、よろしくない文章になるんです。
■日本語(原文)
近年のNMTの進展により、従来は自動翻訳が非常に困難だった日本語文章の英語への自動翻訳精度が飛躍的に向上した。
■従来技術(統計翻訳=SMT)で英訳
The Development of NMT in recent years, conventional automatic translation was very difficult to machine translation accuracy of Japanese sentences in English has improved
ところが、これをニューラルで翻訳すると、すごく流暢な訳文になります。
■AI時代の技術(ニューラル翻訳=NMT)で英訳
With the recent development of NMT, the automatic translation accuracy of Japanese sentences that had previously been very difficult to translate has improved significantly.
ただし、ニューラルによる翻訳にも欠点があって、100%の答えを出せるわけではないんです。この例文では、ニューラルによる翻訳だと「英語への」というフレーズが抜け落ちてしまっています。正確に訳すのなら、「translate into English」といったフレーズが入らないとダメですよね。
これが時々重要な単語が抜け落ちてしまうという、ニューラルの典型な誤りです。それが今、大きな課題になっていて、世界中の研究者がこの問題を解決すべく競争しています。
覚えさせるデータを増やせばいいという問題ではないのですか。
隅田:アルゴリズムをもうちょっと整理していく必要があると思います。覚えさせる量が増えればより流暢になるのですが、たくさん覚えさせても、こういう誤りは起きてしまいます。そこは、アルゴリズムの改良が必要と思われています。
ただし、それでも非常に良い翻訳ができるようになったことは事実です。NICTの音声翻訳システムもニューラルに移行したことで、タクシーや買い物などで使った時に意味が通じる翻訳をする率が2割くらい向上しました。非常に効果が出ています。
米グーグルが変えた自動翻訳の競争環境
NICTではニューラルの研究はいつ頃から取り組んできたのですか。
隅田:2013年からずっとやっていたんですが、先ほど申し上げていなかった欠点が実はもう1つありまして、本格的に移行できていませんでした。それは、非常に大きな計算量が必要だということです。
その計算をするには、GPU(画像処理半導体)という計算機を使うわけですが、非常に値段が高い。システムを作るのに大きなコストがかかるだけではなく、それを一般の人に使ってもらうときにも高いサービスになりかねません。そのため、タイミングを迷っていました。
それなのになぜ、我々もニューラルに移行したかというと、昨年秋に米グーグルがニューラルを使ったサービスを出し、米マイクロソフトもその動きに即座に追随して、我々も負けてはいられないと判断したのです。
実は、中国の検索大手バイドゥは数年前からニューラルを使った翻訳サービスを出していたんですよ。しかし、日本人の我々にはほとんどインパクトがないので、誰も気にしていませんでした。ところが、グーグルが出すと、みんなその精度の高さにショックを受けたというわけです。
「グーグル翻訳(Google Translate)」ですね。
隅田:はい。それまでグーグルの翻訳は、必ずしも精度の高いものではありませんでした。機械翻訳に典型的な誤訳も多いという印象でした。ところが、ニューラルでやると、これほど翻訳精度が向上するのかと、翻訳関係の人たちはびっくりしたわけです。そこで我々も、最新の技術に取り組んでいるということを皆様にも理解してもらうために、今年6月にニューラルを使った翻訳を出しました。
我々が独自に技術を開発する意義は、誰もがグーグルのようなクラウドサービスを使うわけにはいかないからです。情報の秘匿性を考えると、ビジネスではグーグルの翻訳サービスを使えないという企業もあるはずです。日本の国立研究所としては、そうしたニーズにもしっかりと対応する必要があります。
日本独自に自動翻訳の技術を向上しておかないと、情報を海外企業に持っていかれるリスクもあるということですね。
隅田:絶対に情報を外に出せないというケースもあります。個人情報の塊である病院のカルテのような情報とか、防衛関連の情報とかはその典型でしょう。特許やIRに関連する情報も、企業の外には出しにくい。秘密を守りながら翻訳しなければならない分野は、数多くあります。
隅田:日本では、自動翻訳の研究を何十年も前からやってきた歴史があります。2014年には、当時の新藤総務大臣が我々の自動翻訳のシステムをご覧になって、これを2020年の東京オリンピックに向けてぜひ多言語化して、海外から来る人たちに使ってもらおうということになりました。それから総務省の予算を集中的に投下してきています。
NICTの中に先進的音声翻訳研究開発推進センター(ASTREC)を作り、日本の企業から出向で研究員に来ていただいて、40人くらいのチームを作りました。出向元の企業はパナソニックやNEC、富士通、日立製作所、東芝、ソニー、NTT、KDDIなど多岐にわたります。翻訳エンジンはNICTで作り、そのエンジンを企業にいろいろな形で使ってもらうというものです。
技術の進歩はここに来て急速に速くなっています。自動翻訳は、人間の通訳や翻訳に比べて圧倒的に低コストですし、24時間365日休まず働いてくれます。しかも、多言語対応が容易です。既に、日本人の平均的な語学力は完全に超えているレベルに達しています。
TOEIC800点レベルは超えている
TOEICで換算すると、NICTの翻訳エンジンは800点レベルと聞いたこともあります。
隅田:TOEIC800点レベルというのは誰かが想像で言っているのですが、私も800点はいっているだろうと思っています。
800点なら、日本人の平均のかなり上ですよね。
隅田:非常に流暢な英語力ですね。
海外駐在に最低限必要な水準も……
隅田:超えていると思いますね。
既にご説明したように、データ量が増えれば性能は良くなりますし、アルゴリズムも世界中で開発競争が起きていますので、どんどん進化します。近い将来、自動翻訳は人間にとってもう手放せないツールになるというか、頼っていくような状況になると思います。
会議の同時通訳をAIがやる世界がすぐそこに
ビジネスにおける会議に外国人が入る場合、同時通訳に頼る場合も多いですが、会議の同時通訳を翻訳AIが担うような世界も、身近に来ているのでしょうか。
隅田:自動翻訳の究極のビジネス・アプリケーションは同時通訳だと考えています。会議のような雑音が入りやすい場所は苦手なのですが、一人ひとりマイクを付けるような方法なら、非常に近い将来、十分に実現できるのではないかと思います。
10年後にはもうかなり?
隅田:ええ、もうできているでしょう。
実際、既にそうしたアプリケーションを作る場合のインターフェースはどのようなものがいいのか、実験できる技術レベルには達していると思います。イヤホン内蔵型のマイクでやるのがいいのか、会議の参加者が翻訳された内容を文字でも確認できるように、それぞれの席の前にモニターを置いたほうがいいのかといった、具体的なアプリケーションを考えられる段階に来ています。
インターフェースとしてはまだこなれていませんが、まさに作り始めているといった状況ですね。
音声と文字で同時に確認できるというのは、翻訳AIならではの仕組みですね。
隅田:テレビ会議には、非常に適したツールになるでしょう。アジアに工場を持っている日本企業は多いですよね。これまででは、お互いに第2言語である英語を使ってコミュニケーションする場合がほとんどだったと思いますが、これからは、自動翻訳システムを介してお互いに母国語でコミュニケーションができるようになります。そうなれば、お互いに不得意な英語で会話をするよりも、ずっと効率的なコミュニケーションができると思います。お互い第2言語で話すと、言いたいことが言えない、伝えたいことの何割かしか話せないといったことが起こりますから。
そうした状況になると、TOEIC800点などテストで高得点を取ることを目指して勉強するのが、意味がないようにも思えてきます。むしろ、英語は翻訳AIに任せて、人類は他のスキルを磨いてより高い次元のコミュニケーションを目指した方がいいという考え方もあるかもしれませんね。
隅田:絶対にそうだと思いますね。使える道具が出てきたら、使ったほうがいいでしょう。人類の移動手段が馬車からクルマに移行したのと同じことです。馬車とクルマとでは、生産効率が全く違いますよね。英語も、同じだと思います。
ビジネスをやるうえで英語はツールです。ビジネスで重要なのは、そのツールに乗せて相手に伝える質のいいコンテンツ、中身でしょう。全てのビジネスパーソンが英語を上手くなる必要は、必ずしもないはずです。
ビジネスの中心も今後、英語圏から中国圏に移るかもしれない。東南アジアの国々とのビジネスも、これからますます重要になるでしょう。そのたびに、現地の言葉を話せるようになることを目指すよりは、機械に任せるという選択肢もあった方がいいと思うんです。
もちろん、それぞれの言葉を専門とする通訳者や翻訳者の仕事はなくならないでしょうが、誰もが通訳者や翻訳者を雇えるわけではないですよね。コストを安く抑えるには、自動翻訳・通訳システムを使った方が良いのではないでしょうか。もう、翻訳精度が箸にも棒にもかからなかった時代は終わったのですから。
もう「英語ができない」と文句を言わなくて良くなる
近い将来、翻訳AIがビジネスで本格的に使えるようになるということが、よく分かりました。ですが、最低限の英語力というのは、やはり必要なのではないでしょうか。
隅田:ええ、基礎的な英語力はあった方がいいと思います。ただし、その英語力は、現状のままでいいと思います。特に、これまでより高い水準を目指す必要はないでしょう。
日本人の多くは、英語を中学、高校と勉強して、一部の人は大学でも勉強しています。既にかなりの時間を英語学習に割いていますよね。ところが、これまで多くの人が、こんなに勉強したのに英語ができない、話せないと嘆いてきました。これからは、そうした状況に文句を言うのではなくて、それで十分という世界になるのではないでしょうか。
例えば、文書を翻訳する場合、まず自動翻訳に下訳を作ってもらって、その後に人間が中学や高校、大学で学んだ英語を使って、必要があれば加筆・修正して、さらに良い翻訳を作るということが、当たり前になるのではないでしょうか。冒頭にお話しした通り、機械翻訳は100%正しいわけではありませんから。
こうすることで、文書が自分の専門外の分野であっても、自動翻訳を使えばどんどん翻訳できるようになります。例えば、医療分野は私の専門外ですが、試しに医療関係の論文を自動翻訳を使って訳してみたんです。そうすると、少し時間はかかっても、全く医療分野の知識がない私でも、難しい論文でもちゃんと翻訳できるんですね。それは、私という人間の能力が、自動翻訳によって拡張したことを意味します。こうしたことが、あらゆる人に起こり得ると考えています。
まあ、英語の場合は多くの日本人が勉強していますが、中国語などそれ以外の言語については、ほとんどの人にとって、自動翻訳に頼り切ってしまう状況になるかとは思いますが。
先ほど、翻訳のアルゴリズムは世界の研究者が開発競争を繰り広げているので、どんどん進化していくとおっしゃられました。一方、翻訳精度を高めるために必要なAIに覚え込ませるデータについては、NICTはどのように集めているのですか。
隅田:「翻訳バンク」という取り組みを2~3年前から始めています。それまでNICTは、ウェブ上にある翻訳を使っていました。例えば、大企業では日本語のページと英語のページがありますよね。しかし、それだけではデータが足りません。
隅田:そこで、民間企業に社内にあるデータを提供してくださいとお願いしています。現在は29組織が協力してくれています。NICTはパブリックセクターですから、ライバル関係にある会社でも、翻訳という競争領域ではない分野では協力しやすい。むしろ、協調し合って自動翻訳の精度を高めていきましょうと話をしています。自動翻訳の精度が高まって海外からの情報を得やすくなれば、国全体のためになります。
現在、日本全体で年間2000億~3000億円が翻訳作業に費やされています。それを、文章の数に換算すると、だいたい5億文くらいに相当します。仮に5億文のデータを学習させることができれば、今と段違いの高精度の自動翻訳ができるようになります。それを10年間継続すれば50億文ですから、さらにもう一段、ジャンプできると思います。
現在、どれくらいの数の文章を覚え込ませているんですか。
隅田:それは言えません。ライバルのグーグルやマイクロソフトも、そこは一切、開示していないですね。
そこが今、競争の肝になっているからですね。
隅田:そうです。
グーグルはウェブ上にサービスとしてグーグル翻訳を提供していて、そこで使ってもらうことで例文を集めているようにも見えます。
隅田:はい。ただ、間違った翻訳結果を、どれくらいのユーザーが正しく直して、グーグルにフィードバックしているでしょうか。逆に言えば、悪意があるユーザーがいれば間違った翻訳をグーグルに覚え込ませることもできるわけです。
我々は翻訳バンクを通じて、グーグルもマイクロソフトもやっていない手法でデータを集め、精度を高めていきたいと考えています。
「中国語・英語」の翻訳精度が最も良くなるかもしれない
AIに覚え込ませるデータ量が精度向上のカギの1つだとすると、例えば、その言語を話す人口が多い国の方が、良い自動翻訳システムを手にできるということにはなりませんか。つまり、例えば、中国語・英語は飛躍的に精度が上がるけれども、日本語・英語の精度はそれに追い付けないということが起き得るのではないでしょうか。
隅田:それは正しい指摘かもしれませんね。翻訳の精度がデータ量に依存するシステムですので、データが集まらない以上、システムの性能は高まりません。そのため、日常的に多くのデータが生産されている国のシステムがどんどん強くなっていくというのは、その通りだと思います。
実際、中国圏と英語圏の人口が一番多いですし、経済規模も大きいですよね。しかも、中国語と英語は文法が似ていますので、比較的、翻訳するのは簡単なんですよ。
我々のシステムでも、日英、日中、日韓と比べると、実は日韓の性能が一番良くて、日中がその次で、日英が一番、翻訳精度が良くないんです。
日英が一番、難しいんですか。
隅田:一番難しい。
その理由は、単語を翻訳する順序に関係があるんです。例えば、英語から日本語に訳すのは、比較的やりやすいんですね。まず英語の音声認識は、ネイティブスピーカーのように、ほぼ100%正しくテキスト化できるようになっていますから。さらに、英語の語順はS(主語)、V(動詞)、O(目的語)ですので、機械も十分に落ち着いて翻訳できます。
一方、日本語から英語に訳すのは難しい。日本語を聞き取り理解するというのは、十分に高いレベルまで来ていますが、訳すのが難しいのです。語順がSVOの英語に対し、日本語はS、O、VでVが最後に出てきます。つまり、同時通訳をやろうとすると、一番重要な動詞を聞く前に訳し始めなくてはいけないわけです。この、動詞を推測しながら翻訳するのが、すごく難しいんです。
つまり、より高度なアルゴリズムが必要になるということですね。
隅田:そうです。日本語から英語に翻訳するのが難しいというのは、人間でも機械でも一緒なんですね。ある種の真理と言いますか、やっぱりそうかと言う感じですね。
自動翻訳が進化することで、日本人にとっての英語の必要性や、英語学習のやり方も変わってきそうですね。
隅田:これからも、機械を一切使わずに自分ですべてをやるんだという選択肢も、当然あります。その一方で、機械の使い方を習熟して、それをうまく使いこなすという選択肢は確実に重要になってくるでしょう。
例えば、日本人の多くが英語を話せない理由の1つに、「全然、伝えたいことを話せなかった」というような失敗体験が心理的な壁になっているという見方も良く聞きます。しかし、ゼロから外国人と英語で話そうとして失敗して落ち込むより、機械が訳してくれたものをちょっと話してみたり、機械も使って伝えたいことを補足したりして、「外国人と英語で話せた」という成功体験を積み重ねるのも、上達の近道になるかもしれません。
また、機械が正しく訳してくれるような日本語を話す、書くという訓練を積むのも、これからの語学学習では重要になる可能性もあります。日本語を話す時も、主語をしっかり明確にするとか。そうすれば、論理的に物事を考える訓練にもなりますし、機械だけではなく、自分で英語を話すときも、英語に訳しやすくなります。当然、機械も英語に訳しやすいだけではなく、中国語や韓国語も正確に訳してくれます。
計算するのにも、算盤から電卓、コンピューターへとツールが変わってきました。コミュニケーションも、翻訳AIが出てきたことで、いよいよツールを積極的に活用していく時代に入るということですね。
隅田:算盤を時間かけて覚えるというのも、頭の中でいろいろと計算ができるようになるので、それは素晴らしいことです。しかし、多くの人にとっては、電卓を使って計算した方が早いし、効率的ですよね。
これからの英語学習も、結局は何のために英語を使えるようになりたいのか、という目的次第だと思います。英語をすべて自分で話すことが必要な人は、そういう勉強をすればいいし、そうでない人は、自動翻訳を積極的に活用して、浮いた時間を別のスキルの習得に回すという発想もあっていいでしょう。
登録会員記事(月150本程度)が閲覧できるほか、会員限定の機能・サービスを利用できます。
※こちらのページで日経ビジネス電子版の「有料会員」と「登録会員(無料)」の違いも紹介しています。