谷川耕一「エンプラITならこれは知っとけ」

最近流行の機械学習、高度な統計処理との違いはどこにあるのか

谷川耕一

2015-09-16 07:00

 機械学習が大流行だ。ここ最近、「機械学習を活用した×××」であるとか「機械学習技術を応用した×××」と言った発表がわんさかある。ところが、これらの発表会に参加してみると「それって本当に機械学習技術なの?」と頭の中にクエスチョンマークが浮かぶようなものもちらほら。機械学習と高度な統計処理の違いはいったいどこにあるのか、はたまた機械学習は人工知能(AI)の一種なのか。

 「AIには裏定義があって、それが実現できてしまえばすでにAIではなくなるなんて話もあります。機械学習についても、実は同じような面があると思います」と話すのは、国際大学GLOCOM 准教授で主任研究員の中西崇文氏だ。中西氏の専門分野はビッグデータやデータ分析、特に相関分析に関わる技術の開発だ。さらにはメディア論、人間の感性をコアとして異種、異分野の協働による価値創生に関わる問題なども対象に研究を行っている。

 中西氏によれば、機械学習と統計はすっぱりと分かれているとのこと。


国際大学GLOCOM 准教授 中西崇文氏

 「統計はすでにデータがあって、それがどういう傾向にあるかを表すものです。これに対し機械学習は、データから異常値を見分けるものです。機械学習にも統計的な要素を使います。統計的なども使って、データの集合を何らかの手法で分けるものだと捉えると良いでしょう」(中西氏)

 だから、データを収集し「このデータにはこういう傾向がありました」と言うのを、機械学習だと表現するのはちょっと怪しいとのこと。そして、もう少し最近の傾向を分かりやすい説明をするならば、たまっているデータについて何らかを述べるのは統計で、データが流れてきた際に「Yes/No」を判断するようなものは機械学習と捉えても良いだろう。

 また、機械学習にも学習ありとなしの2つの種類がある。学習なしは統計ならばクラスタリングなどの技術を使うもので、データだけを見て振り分けることになる。一方、学習ありの機械学習では「分類機」を作って判断する。こちらの場合は、ストックした情報があることになる。

 「どちらの方法もロジックとしては同じようなものを使うことがあります。分類機なしでストックしたデータ全体について語れば、それは機械学習ではなく統計になります」(中西氏)

ZDNET Japan 記事を毎朝メールでまとめ読み(登録無料)

ZDNET Japan クイックポール

所属する組織のデータ活用状況はどの段階にありますか?

NEWSLETTERS

エンタープライズコンピューティングの最前線を配信

ZDNET Japanは、CIOとITマネージャーを対象に、ビジネス課題の解決とITを活用した新たな価値創造を支援します。
ITビジネス全般については、CNET Japanをご覧ください。

このサイトでは、利用状況の把握や広告配信などのために、Cookieなどを使用してアクセスデータを取得・利用しています。 これ以降ページを遷移した場合、Cookieなどの設定や使用に同意したことになります。
Cookieなどの設定や使用の詳細、オプトアウトについては詳細をご覧ください。
[ 閉じる ]