機械学習のプロセスを自動化する「AutoML」が、昨今徐々に話題になってきています。
本記事ではこのAutoMLについて、まだ知識のない人でも簡単に理解できるように、なるべくわかりやすく解説していきます。
まずはどのようなものなのかといった基本的な内容説明を行った上で、具体的にどのような活用メリットがあるのかを理解し、さらには代表的なAutoMLツールをご紹介していきます。
<目次>
さくっとわかるAutoMLのすごさ
・AutoMLの仕組み
・AutoMLが注目されるワケ
代表的なautoMLツール
・AutoML Table(Google)
・Automated ML(Microsoft)
・AutoAI(IBM)
・ForecastFlow(GRI)
・H2O Driverless AI(H2O.ai)
・DataRobot
・Prediction One(Sony)
・MatrixFlow
・Nanonets
・dotData
AutoMLとは
AutoML(Automated Machine Learning)とは直訳すると「自動化された機械学習」ですが、機械学習モデルの設計や構築を自動化すること、またはそのための手法全般を指します。
例えば、1行のプログラミングコードだけで機械学習の機能を呼び出せるようなイメージです。実際、AutoMLの機能付きのフレームワークが存在します。このフレームワークは、機械学習の機能を簡単に呼び出せるようにあらかじめパッケージされたものだと考えておくとわかりやすいでしょう。
AutoMLは厳密にはもっと広範囲に機械学習の自動化を意味する用語なのですが、現状ではフレームワークなどから呼び出す使い方が一般的です。
さくっとわかるAutoMLのすごさ
AutoMLのすごさは、高機能な機械学習の機能を自動化できるということです。結果的に、ユーザーは機械学習の仕組みなどに精通していなくても機械学習の機能を利用できます。単にサービスを利用するだけでなく、例えば自社システムに機械学習を取り入れることができるようになるのです。
AutoMLの仕組み
AutoMLは機械学習を自動化するということでしたが、具体的に何をどのようにできるのか、イメージがつかない方もいらっしゃるのではないでしょうか。そもそも機械学習では何が行われているのかを理解しておく必要があります。
機械学習を行うプロセスとして、問題や仮説の定義、データ収集、データ加工、特徴量設計、機械学習モデルの生成、モデルの運用といったステップがあります。これらのステップの中で、問題定義や一部データ収集などは人が行う必要がある一方、データの加工からモデル設計までは自動化できるようになってきています。この自動化を行うのが、AutoMLです。
AutoMLが担う具体的な処理としては、データの整形や表示するデータの選択、プログラムの改変、問題点の自動修正、などがあります。他にも、自動的にバグを検出して修正したり、システムのアップデートに合わせて他の部分も自動的に書き変える、といった機能も実用化されつつあります。現段階の目標としては、プログラムが自動的にプログラムを作ることだとよく言われています。
AutoMLが注目されるワケ
ビジネス上で重要なのは、技術の探求ではなくその実用性です。機械学習も同様で、機械学習そのものではなく、機械学習を用いて何をするのかが重要とされています。そして、今後活躍する場面が増えてくるであろうこの機械学習のプロセスの一部を自動化し、データサイエンスの専門知識がなくても簡単に使えるようにする仕組みが、AutoMLなのです。
AutoMLは、設定が不要もしくは簡単で、プログラミングの必要性がありません。さらに、データサイエンティスト数名で取り掛かっても時間のかかる機械学習プロセスを短縮できます。そのため、データサイエンティストの人手不足や機械学習プロセスの効率化に繋がり、結果的に機械学習を用いたアウトプット量を格段に増やすことができるのです。
代表的なAutoMLツール
次に、代表的なAutoMLツールを紹介していきます。
AutoML Table(Google)
GoogleのAutoML Tableは、AutoMLの中で最も知名度が高いものでしょう。データの自動処理を主な機能として持ち、具体的には数値や文字列などのデータを自動的に整形し、問題があれば抽出することを自動化できます。
今のところは主にエンジニア向けのツールですが、他のAutoMLツールと比較すると、アップデートが頻繁に行われる分最新の技術が反映されやすい、情報が多い分扱いやすい、といった特徴があります。
Automated ML(Microsoft)
MicrosoftのAutomated MLも機械学習モデルを簡単に構築できるツールですが、平たく言えばデータの整形を自動化するものです。GoogleのAutoML Tableの次に知名度があり、その分ネット上にも情報が多いです。
AutoAI(IBM)
IBMのAutoAIも同様にデータの整形、抽出を便利にする、といった機能を持ちます。
ForecastFlow(GRI)
ForecastFlowはデータサイエンスが多く在籍するGRI(当社ビジネスパートナー)によって開発され、実践的なAutoMLをノーコードで使える所が特徴です。大規模データを高速に処理できるため試行錯誤しやすく、機械学習を実業務に組み込みやすいため導入実績も豊富です。
H2O Driverless AI(H2O.ai)
H2O Driverless AIは、シリコンバレーで2012年に創設されたAIを専門とする企業、H2O.aiが提供するAutoMLです。日本国内では2019年から導入が始まっており、Dell Technologiesと提携しているため、デルのハードウェア上で大きなパフォーマンスを発揮するという特徴があります。
DataRobot
DataRobotは100社以上の企業で導入されていて、アコム、ANA、Calbee、といった有名企業にも導入されています。最近では、自動特徴量探索機能が進化していたり、データの異常を察知して想定外のイベントの根本原因を把握することができるようになっています。
Prediction One(Sony)
SonyのPrediction Oneは、GUI(Graphical User Interface)で直感的に操作しやすいという点が最大の特徴です。autoMLの根幹にあるのはAIによるデータ活用を簡単に自動化するということなので、その点でPrediction Oneは理にかなっています。
MatrixFlow
MatrixFlowは1,000社以上に導入されている使いやすいautoMLです。機能性はシンプルで、自社データからの予測、自動抽出、などを得意としています。結果的に、正確な売上予測、不良品判別、社員の能力分析などを実現します。
Nanonets
Nanonetsは最小限の労力でautoMLを扱える仕様になっています。導入事例としては、画像認証、オブジェクト分類といった図形を認識する機能に定評があります。
dotData
dotDataも機械学習プロセスを自動化するAutoMLツールです。データ収集・加工からモデル設計、可視化、運用までのプロセスを数ヶ月から数日に短縮できます。
まとめ
機械学習やAIと聞くと自動で動くものを想像しがちですが、その前提として、データ収集やデータ加工、特徴量設計などの複雑かつ専門知識のいるステップがあり、自動で動くまでに長い時間と人手を要するものです。
そのような中、今注目されているのが、機械学習のプロセスを一部自動化するAutoMLです。データサイエンティストの人手不足に頭を悩ませている方は、ぜひ一度検討されてみてはいかがでしょうか。