Weitz氏にとっての最高水準とは、休暇の計画など、複雑な「経路をつなぐ」シナリオを実行できるようになることだ。旅行代理店の担当者や、知識豊富な友人と会話しているかのように、デジタルアシスタントはクエリにリアルタイムで答え、会話が進む可能性のあるさまざまな経路や分岐を予測し、概念やコンテキスト、変数(天気や座席の好み、ホテルの空き状況、為替レートなど)を理解して、トランザクションを完了できなければならない。
さらには、ユーザーはナチュラルユーザーインターフェースと拡張現実感を使って、ジェスチャーで表現したり、絵画や建物などのオブジェクトを指したりできる。そうするとパーソナルアシスタントはそのオブジェクトについての関連情報を音声や画面で伝える。さらに次の質問を予想して、ありそうな答えを事前にキャッシュに格納しておく。
「われわれはルールセットを通してではなく、ユーザーが話す内容を理解することによって、より深い会話をしたいと考えている。そのためには会話の予測モデルをもっと改良する必要がある」(Weitz氏)
Bing検索と「Windows」では既に、Satoriの知識レポジトリが使用されている。Bingには一目で分かる回答、つまり人や場所、ものについての「Snapshot」を表示する機能がある。また、ユーザーが入力する際に、クエリのあいまいさをなくし、回答をより素早く得られるようにするオートサジェスト機能もある。Google検索はKnowledge Graphを使って同様の機能を提供している。
「Windows Phone 8」の「Local Scout」機能では、ユーザーの位置や、以前の検索、Facebookの友達からのお勧めに沿って、クーポンやレストラン、音楽、そのほかのエンティティについて、そのユーザーに合わせたお勧めの情報を提供する。
Microsoftは6月に開催されたBuild 2013でEntity APIを発表した。これにより開発者はSatoriを利用して、音声入力やOCR機能、言語翻訳機能を備えた自分のアプリに検索を組み込めるようになる。しかしEntity APIは「Windows 8」「Windows 8.1」「Xbox One」でしか動作しない。
Microsoftの慎重なアプローチは、「Microsoft Bob」の教訓を踏まえたものかもしれない。Microsoft Bobは1995年に導入されたバーチャルアシスタントで、ユーザーがWindowsを操作したり、Microsoftアプリケーションでタスクを実行したりする際にサポートを提供するためのものだった。Microsoft Bobはユーザーにとって便利な機能にはなれず、冷笑を浴び続けながら短期間提供され、1996年初めにはこの世から消えてしまった。
「Microsoft Bobには、ユビキタスなインターネット接続や、知識の世界へのアクセスが整っていなかったため、成長できなかった。現在では、われわれには計算能力や、人々やオブジェクトが残すデジタルフットプリント、さらには驚異的なレベルのコンテキストがある。きちんと機能するエージェントを実際に構築するのに必要な材料が、初めてすべてそろっている」とWeitz氏は述べた。
「いくつかはわれわれの製品に現在使われており、将来的にはもっと増える。現在複数のチームが、これに熱心に取り組んでいる」(Weitz氏)
その一方で、AppleのSiriとGoogle Nowは、販売されているモバイル端末の圧倒的多数に組み込まれており、ユーザーや世界についてより多くのことを学習し続けるとともに、より会話的になりつつある。Microsoftが検索の王者Googleの裏をかけるかどうか定かでない中、たとえ革新的なBingエージェントをもってしても、「iOS」と「Android」がモバイルの世界を支配し続ける状況では、MicrosoftがSiriとGoogle Nowを一気に追い越すのはたやすいことではないだろう。
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。
CNET Japanの記事を毎朝メールでまとめ読み(無料)
ものづくりの革新と社会課題の解決
ニコンが描く「人と機械が共創する社会」
「もったいない」という気持ちを原動力に
地場企業とともに拓く食の未来
地味ながら負荷の高い議事録作成作業に衝撃
使って納得「自動議事録作成マシン」の実力