ケータイ用語の基礎知識

第829回:Alexa とは

Amazonの音声認識AIエージェント

 「Alexa(アレクサ)」は、米Amazonが開発した音声認識AIエージェントです。年内にも日本語で利用できるAlexa対応デバイスが発売されます。

 もともとは、米国で同社の販売する音声認識スピーカー「Amazon Echo」の音声認識エンジンとして提供が始まりました。「Echo」は、茶筒のような形をしたBluetoothスピーカーで、ユーザーが話しかけた言葉を理解し、それに応じてスピーカー自身や周辺の電子機器など、さまざまなものをコントロールできます。

 ユーザーが話しかけたことを理解し、状況に応じた回答するための仕組みが「Alexa」なのです。

第829回:Alexa とは 北米で展開されている「Amazon Echo」などAlexa対応の製品群
北米で展開されている「Amazon Echo」などAlexa対応の製品群

「スキル」を利用することで応用可能に

 Alexaは、GoogleアシスタントやSiriなどと同じように、天気情報、株・為替情報について聞かれた場合、音声で回答できます。

 Amazon製ということで、Amazon Musicのライブラリにある楽曲を再生したり、Kindleで購入した書籍の内容を読み上げたり、あるいはAmazonで買ったことのある商品を再注文したりできます。

 さらに2017年現在では、「Alexa Skill Kit」というスキル開発キットや、「Alexa Voice Service」というAPIが公開されていて、Echoだけでなく、他社製品にも組み込めるようになっています。

 「スキル」とは、Alexaの拡張機能のことです。Alexaから他のスイッチなどをコントロールできるようなアプリを作成し、作成者は「Alexa Skills Marketplace」に自作のスキルを公開できます。

 Alexa対応デバイスとして、2017年10月末現在、米国で販売されているのはAmazon Echo(初代・2代目)、Echo Dot、Echo Plus、Echo Spot、Echo Showなどです。これらのユーザーは、スマートフォンやパソコンへ「コンパニオンアプリ」をインストールします。音声操作だけでなく、スマートフォンアプリで利用できるのもAmazon Alexaの特徴です。なお、Alexaのコンパニオンアプリは、スマートフォンではAndroid、iOSどちらにも用意されています。

 このスキルをインストールすると、Alexaのみではできなかったものまで、コントロールできるようになります。

 たとえば、英語圏のAlexaではフォードが開発したスキルが提供されています。このスキルでは、フォードの「Focus Electric」「Fusion Energi」といったクルマをAlexaからコントロールできるようにしたものです。たとえば「Alexa、フォードのドアをロックして」「Alexa、フォードのエンジンをかけて」と英語で話しかけると、リモートコントロールでドアをロックしたり、エンジンを始動したりできるのです。

 全世界では2017年10月現在、すでに2万以上のスキルが登録されています。Alexa日本語版に関しては、すでにNTTドコモ、KDDI、ソフトバンク、JR東日本、クックパッド、ヤフーなどが「スキル」の提供を表明しています。

Amazonのクラウド技術の集大成

 Alaxaは、クラウド上の音声認識エンジンや、エンジンが認識した文字列から「インテント」と呼ばれる“スキルへの命令変換”、スキルが呼び出した命令へのレスポンスをEcho Dotなどに返す……とAmazonが提供しているクラウドサービスをひとまとめにして提供するものとも言えます。

 Amazon Echoなどのデバイスから、ユーザーの音声データがネット経由で、Amazonのクラウド上の音声解析エンジンに送信され、ユーザーが離した内容を解析します。Alexaへの命令であることを確認すると、命令の内容から、さらにネットワークを経由してスキルへの命令を行ったり、あるいはAPI経由で得た各種データを音声としてEchoなどのデバイスに返します。

 Amazonという企業は、Amazon.co.jpなど通販会社として有名ですが、チャットボットサービス「Amazon Lex」テキストからの音声読み上げサービス「Amazon Polly」などさまざまなWebサービスも提供しているクラウドコンピューティングの大手企業でこの手の仕組みはお手のモノであるといえます。

 逆にいうと、Alexaを動作させるにはAmazonに接続できるインターネット回線が必須です。ネット回線なしではほとんど何も機能せず、Amazon EchoもBluetoothスピーカーとしての役目しか果たせません。

大和 哲

1968年生まれ東京都出身。88年8月、Oh!X(日本ソフトバンク)にて「我ら電脳遊戯民」を執筆。以来、パソコン誌にて初歩のプログラミング、HTML、CGI、インターネットプロトコルなどの解説記事、インターネット関連のQ&A、ゲーム分析記事などを書く。兼業テクニカルライター。ホームページはこちら
(イラスト : 高橋哲史)