騒がしい場所でも機能する翻訳アプリ&デバイス
訪日外国人を案内・誘導するとなれば、やはり翻訳ツールが必要となる。すでに市場には様々なデバイスおよびサービスが出まわっているが、アドバンスト・メディアのスマートフォン向け多言語音声翻訳アプリ「AmiVoice TransGuide」(iOS / Androidに対応)は、ちょっとユニークな機能により競合との差別化を図ろうとしていた。
その特徴のひとつが、約90dBの騒音環境下でも音声認識できる小型デバイス「AmiVoice Front WT01」と連携できる点。高指向性2マイクアレイを搭載した同製品を使えば、人混雑の中でも正確な音声を取得できる。実際に、騒然とした展示会場で試してもらった。担当者が「今日はとてもいい天気ですね」と喋ると、スマホアプリのAmiVoice TransGuideが中国語に翻訳、AmiVoice Front WT01からは中国語の音声が再生され、スマートフォンには日本語文と中国語文が表示された。ちなみに、ここで使われている音声認識技術AmiVoiceは、AIにより認識精度が向上しているという。
AmiVoice TransGuideは現在のところ、4ヵ国語(日本語、英語、中国語、韓国語)の双方向音声翻訳に対応している。なおバックヤードを明かすと、音声を認識してテキスト化するところまではアドバンスト・メディアのエンジンを、翻訳はGoogleのサービスを利用している。
本製品は、外部スピーカーと接続して使うこともできる。喋った日本語をその場で任意の言語に翻訳し、大音量のスピーカーで流せるため、たとえば混雑したオリンピック会場や鉄道の駅などで、運営スタッフが外国人を誘導するケースで便利に利用できる。
こうした翻訳機の弱点として、しばしば「固有名詞」「専門用語」「地名」などに弱いことが挙げられるが、AmiVoice TransGuideでは単語登録により、あらかじめよく使う言葉を1,000行ほど学習させておくことが可能。現場のニーズに沿った使い方ができるようだ。
テロリストを見逃さない!AI人物検索「Takumi Eyes」
オリンピックが開催されると、訪日外国人が増加する。そこで「治安の悪化」や「交通機関の混雑」を懸念する人もいるだろう。これについては、NTTグループが興味深い展示をおこなっていた。
NTTコミュニケーションズのAI人物検索技術「Takumi Eyes」は、防犯・警備への活用が期待できるサービスだった。顔認識を防犯カメラに適用する場合、カメラの解像度や画角の問題がある。そこで同サービスでは「顔認識」と「全身認識」のハイブリッドで人物を検索できるようにした。
「国際テロリストの写真があれば、すぐにヒットする。有事の際、どこを何時何分に逃げたかが分かるので、警察の捜査にも役立てられる」と担当者。
全身認識の照合技術に、AIを活用した。たとえば「ベージュのシャツに、黒ズボンの人物」を複数の映像から検索する場合、映像によっては光の当たり具合でシャツが違う色に見えたり、入れていたシャツがズボンから出ていたり、髪型が変わって見えたり、といったことが起こりうる。従来なら、これは人の目で”同一人物か否か”を判断していた。そこでディープラーニングを使い、どういった特徴から判断すべきかをAIに学習させた。これにより、人物の検索時間が75%削減できた。2時間かかっていた作業が30分で済むようになり、見逃しもなくなり、また運用コストの削減も期待できるという。担当者は「いまはまだ実証実験の段階ながら、すでに自治体や商業施設から引き合いがあります」と説明していた。
乗客にあわせて運行経路が変動する「AI運行バス」
また、NTTドコモでは未来シェアと共同で「AI運行バス」の開発を進めている。これはルートを特定せず、乗客のニーズに応じてAIがリアルタイムに運行経路を決めて走るサービス。乗客のスマホアプリからの要求に応じて、最適な車両を配車する。東京臨海副都心エリアや兵庫県神戸市、鳥取県境港市などですでに実証実験を済ませており、2018年度には商用化したい考えだという。
「東京オリンピックのようなイベント時には、急増した訪日外国人の足となる」と担当者。このほか、地方の観光地や自治体運営のコミュニティバスにつきものの”ドライバー不足”の解決にもつながると解説する。
なおNTTドコモでは、AIにより数時間先の群衆の流れを予測する「近未来人数予測」を開発中だ。観光エリア・商業エリアの群衆の流動を把握できるようになれば、混雑を考慮した台数とルートで効率的に配車するデマンド交通システムが実現できる。また、混雑エリアに警備員を多く配置する、といったことも可能になる。
※走り出したAIタクシーの実力と課題