'; html_body += '
'; html_body += '' + title + ''; html_body += '' + summary + ''; html_body += '
'; dom_floating.innerHTML = html_body; /**/ dom_floating.getElementsByClassName('floating_box')[0].style.bottom = f_bottom + '.px'; /**/ var thumb_elem = dom_floating.getElementsByClassName('thumb')[0]; thumb_elem.addEventListener('click', function(){ location.href = link_url; }); var content_elem = dom_floating.getElementsByClassName('content')[0]; content_elem.addEventListener('click', function(){ location.href = link_url; }); var close_btn_elem = dom_floating.getElementsByClassName('close_btn')[0]; close_btn_elem.addEventListener('click', function(){ dom_floating.classList.add('content_hidden'); }); /**/ dom_ad_float.appendChild(dom_floating); } /** * */ window.AI.unsetF = function(){ } }());

グーグル、自然な会話を実現する言語モデル「LaMDA」発表--高度な検索目指す「MUM」技術も

Stephanie Condon (ZDNET.com) 翻訳校正: 編集部

2021-05-19 12:50

 Googleは米国時間5月18日、自然言語分野における最新のブレークスルーとして、自然な会話を実現する新たな言語モデル「LaMDA」(Language Model for Dialogue Applications:対話アプリケーション用の言語モデル)について発表した。Googleは「Google I/O」の基調講演で、この新しいモデルについて明らかにした。

 最近の「BERT」や「GPT-3」といった言語モデルと同様に、LaMDAは「Transformer」をベースにしている。TransformerはGoogle Researchが生み出したニューラルネットワークアーキテクチャーであり、2017年にオープンソース化されている。

 しかし、GoogleのLaMDAは他の言語モデルとは異なり、会話によって訓練され、自由で流れるような会話方法を身につけている。この訓練によってLaMDAは、与えられた文脈内で筋が通っているだけでなく、具体的な応答を返せるようになった。

 Googleは、例えば「私はギターのレッスンを始めたばかりだ」という言葉に対し、「素晴らしい!私の母は『Martin』のビンテージギターを持っていて、それを弾くのが大好きなのです」といった、意味を成すような筋の通った具体的な返事が返ってくるかもしれないと説明した。

 Googleはまた、洞察や意外性、ウィットに富んだ、「面白みのある」応答などによって対話に深みを持たせる方法を探求している。さらに応答の内容が事実に基づいており、同社の人工知能(AI)原則に合致することを保証するための取り組みも進めている。

 LaMDAは自然な会話に向けた大きな1歩だが、Googleによると、その訓練はテキストのみを用いて実行されている。人と人とのコミュニケーションは、画像やテキスト、音声、動画を駆使して行われため、同社はさまざまな形式の情報に関する質問を、自然なかたちで投げかけられるようなマルチモーダルモデル(MUM)にも取り組んでいる。Googleによると、MUMを用いることで、いずれ「美しい山並みを目にしながら走れるルートを見つけて」とGoogleに呼びかけ、車での旅行を計画できるようになるかもしれない。同社は検索機能とのやり取りをより自然に、そしてより直感的なかたちで実現できるようしようと取り組みを進めており、これはその一例となる。

 例えば、「アダムス山に登ったことがあり、秋には富士山に登りたい。準備はどう違うのか」といったことを知りたい場合、それぞれの山の標高やコース、秋の平均気温、適切な服装や道具など複数の検索を実行して答えを得る必要があるだろう。今日の検索エンジンは人の専門家が返すような答えを返すことができるほど十分に洗練されていないかもしれないが、GoogleはMUMでこのような形の複雑なニーズに応じてユーザーを支援できるようなものに近づけようとしているという。

 MUMはこのようなユーザーの複雑なタスクで、Googleがいかに支援できるかという点で変革する可能性を秘めていると同社は説明している。Googleによると、MUMもBERTと同様に、Transformerアーキテクチャーに基づいているが、その1000倍の性能となっている。MUMは言語を理解するだけでなく、生成することも可能だという。また、75種類の言語を用いて、多くのさまざまな作業を同時にこなすよう訓練されているため、情報や世界の知識を従来のモデルよりも包括的に理解できるようになっている。さらにMUMは、マルチモーダルに対応しているため、テキストや画像の垣根を越えて情報を理解でき、将来的には動画や音声といった他の形式も取り扱えるようになるという。Googleによると、富士山の登山について尋ねれば、MUMはユーザーが2つの山を比べようとしており、標高やコースの情報などが関連するかもしれないと理解できる。ハイキングという文脈で、「準備」にはフィットネスでのトレーニングのほか、適切な道具や服装を見つけるといったことが含まれる可能性があると理解できるかもしれない。

 また、情報にアクセスする際に言語の壁が大きな障害となる場合があるが、MUMは言語間の知識を流通させ、そのような壁を破壊できる可能性もあるという。入力された検索語と異なる言語で記述された情報源から学習することができ、その結果を返せるようにもなる。

 さらにMUMはマルチモーダルであり、ウェブページや画像といったさまざまな形式の情報を同時に理解することができる。いずれ、ユーザーが登山靴の写真を撮って、「富士山の登山でこれらが使えるか?」と尋ねると、MUMは画像を理解し、質問と結び付けて、ユーザーの登山靴がうまく機能するかどうかを知らせてくれるようになるかもしれない。お勧めの道具や服装が掲載されたブログを提示することも可能になるかもしれない。

この記事は海外Red Ventures発の記事を朝日インタラクティブが日本向けに編集したものです。

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ホワイトペーパー

新着

ランキング

  1. 運用管理

    メールアラートは廃止すべき時が来た! IT運用担当者がゆとりを取り戻す5つの方法

  2. セキュリティ

    AIサイバー攻撃の増加でフォーティネットが提言、高いセキュリティ意識を実現するトレーニングの重要性

  3. セキュリティ

    最も警戒すべきセキュリティ脅威「ランサムウェア」対策として知っておくべきこと

  4. セキュリティ

    「どこから手を付ければよいかわからない」が約半数--セキュリティ運用の自動化導入に向けた実践ガイド

  5. セキュリティ

    クラウド資産を守るための最新の施策、クラウドストライクが提示するチェックリスト

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]