パソコンベースの自動電話応対システム“AUTOCALL(オートコール)”の開発を手がける(株)ジー・エフは4日、自社のCTI(Computer Telephony Integration)システムに(株)アドバンスト・メディア(AMI)が開発した音声認識を搭載したと発表した。
ジー・エフが'99年に開発した『GF3002 AUTOCALL』は、Windows NTベースのパソコンに、ダイアロジックシステムズ(株)の電話回線制御ボードを組み合わせたハードウェアと、自動的に顧客に電話をかけてアンケートを取ったり顧客からの問い合わせに自動応答するアプリケーションをセットにしたシステム。このうち、電話回線制御ボードとCTIアプリケーションのインターフェースを受け持つソフトウェアである“電話エンジン”に、今回、AMIの音声認識ソフト『AmiVoice for Telephony』のインターフェースを追加する形で、AUTOCALLシステムに音声認識機能を搭載した。
ジー・エフ代表取締役の仲吉昭治氏 |
AMIのAmiVoice for Telephonyは、同社が米Interactive Systems社と共同開発した音声認識ソフトウェア。音声認識の際にエンロール(※1)が不要で不特定話者に対応し、電話回線に対応した音響モデルと、独自の雑音処理技術によって、携帯電話など雑音の多い状態でも高い認識率を備えるという。また音声認識の際に、話者によって異なるイントネーションやアクセントの違いに左右されない、「あー」「えーっと」といった文脈上意味のない言葉を除外する、などの特徴を持つ。社内で行なったテストによると、雑音の多い携帯電話で95%以上の認識率を得たとしている。
※1 エンロール:音声認識ソフトなどで、認識率を上げるために、用意された文章を読み上げさせるなどしてユーザーの声を登録する作業。アドバンスト・メディア取締役兼最高技術責任者の藤田泰彦氏 |
ジー・エフ取締役の道脇正浩氏によると、以前から音声認識機能について検討してきたが、従来のものはエンロールが必要であったり、不特定話者に対応していても、認識できる単語が限られていたりといった問題があることから、実用にたえないと判断していたという。これに対してAmiVoiceは、不特定話者に対応しており、イントネーションやアクセントの揺れに強いこと、語彙の豊富なこと、不要な語の削除などの機能に優れており、またコンピューター側の負荷も、比較的軽いことから採用を決めたとしている。
音声認識機能を搭載したAUTOCALLシステムの価格は、電話回線の2回線に対応したものが400万円、4回線が500万円、8回線が700万円、16回線が1200万円となっている。10月1日に発売予定で、初年度100回線分、2年目に200回線分の出荷を見込んでいるとしている。
発表会ではAmiVoiceを使った、航空チケットの予約システムのデモンストレーションを行なった。最初は、システムの問いかけに対して1つ1つ答える、
- システム:「搭乗日をどうぞ」
- ユーザー:「9月4日」
- システム:「どこからどこまでですか」
- ユーザー:「羽田から関空」
- システム:「搭乗券は何枚必要ですか」
- ユーザー:「2枚」
といった要領で行なわれた。しかし、こういった手順であれば、タッチパネルを使ったシステムでも可能で、かつ慣れればタッチパネルのほうが早いという。ここで、予約システムの問いかけに対して「9月4日に羽田から千歳空港大人2枚」と連続して発声しても正しく認識され、予約システムのアプリケーションにも、正しく入力されるというデモも見せ、AmiVoiceの能力の高さをアピールした。
AmiVoiceを使い、全国の地名を読み上げて認識させ、テキストに変換するデモ。県名をとばして市部から読み始めても正確に認識することがAmiVoiceの能力の高さを示すという |
ジー・エフ代表取締役の仲吉昭治氏は「例えばこれまでのAUTOCALLを使った自動電話アンケートシステムでは、質問が多くなると電話を切られてしまうため、設問数を数問程度に抑えたり、回答が(電話のプッシュトーンなどによる)選択式のため、選択肢を絞り込む必要があったりした。AmiVoiceによる音声認識機能を取り込むことで、こうした制限がなくなり、応用範囲が飛躍的に広がる」と述べている。
商品の受発注やユーザーサポートにおいて、電話による応対は欠かせないが、すべてを人手に頼ると、対応時間が限られたり、コストがかかることから大企業でないと行なえないなどの問題がある。今回のAUTOCALLのような、高機能な音声認識機能を持った低価格なCTIシステムは、こうした従来の問題点を解決する手段の1つとして注目される存在になりそうだ。