IBMは米国時間2月4日、「Watson」の開発者向けサービス「Watson Developer Cloud」に、新たに5種類の機能を追加した。
追加されたのは、「Speech to Text」「Text to Speech」「Visual Recognition」「Concept Insights」「Trademark Analytics」の5つ。WatsonはIBMが開発するコグニティブコンピューティングシステムで、米国のクイズ番組「Jeopardy!」で勝利したことでよく知られる。
Speech to Textは音声のテキスト変換機能で、音声制御アプリやシステム向けに音声による入力、会議の書き起こしなどが可能となる。IBMによると、Watsonのエラー率は10.4%だが、ユーザーが修正するたびに精度が上がることが期待できるという。まずは英語のみに対応となる。
Text to Speechは英語とスペイン語に対応するテキストの音声変換機能だ。視覚障害のある人向けのソフトウェア設計、あるいは路上で運転手に情報を提供する車載システム向けとしている。
Visual Recognitionは、画像をアップロードするとオブジェクト、背景の色、状況の種類(写真や風景などを認識できる)、使われている色などの要素をWatsonが認識して、分類する機能だ。この機能は、大量の画像を整理するような時に有用だという。
Concept Insightsは、検索にさらなる知恵を加えるものとなり、ユーザーのクエリに関連性を見出し、検索クエリの言語に関連した情報の発見、そして直接表現されていないが関連したコンセプトの発見を支援する。
Tradeoff Analyticsは、優先事項が対立する場合にWatsonに意思決定を支援してもらう機能だ。たとえば医者が患者の処方を決定するにあたって、さまざまな基準から決定することが考えられる。より率直な意思決定の例を挙げるなら、どの車やスマートフォンを購入すべきかに利用できる。結果はテーブルまたはグラフで表示され、ユーザーは自分の好みに応じて基準の重要性を調整できる。
Watsonによる画像認識
提供:IBM
この記事は海外CBS Interactive発の記事を朝日インタラクティブが日本向けに編集したものです。