AIは作ってからが本番 改良支援のスタートアップ続々
生成AIブームでAIの商業利用が急拡大するなか、企業は「AIファースト(新商品・サービスの開発にAIを積極的に活用する考え方)」を目指し、既存のデータ管理方法を見直そうとしている。
各社はAI向けのデータ調達、AIモデルの学習、モデルの性能のモニタリング、新たな規制に対応した倫理システム開発の最適な手段を求めている。
下記の市場マップでは、企業のAIプロジェクトを開発から運用後まで支援する12分野の企業約130社を掲載した。
AI開発には成熟しつつある分野(例:データアノテーション=データに意味情報を付与すること)もある一方で、まだ新しい分野(例:アルゴリズム監査)もある。
各分野の資金調達状況
各分野の概要
機械学習の学習データの収集・整理
AIアルゴリズムの学習プロセスにおけるデータの質の管理を支援する分野。モデルの学習に適したデータのサブセット(部分)の選定、データセットの偏りの判断、ラベル付けの誤りの発見などの重要なタスク(作業)を完了できる。これにより、質の低いデータがAIの性能に及ぼす影響を最小限に抑えられる。
▽23年に入ってからのエクイティ調達額と件数:200万ドル、1件
▽この1年の従業員数の増減:+43%
▽この分野の企業: Scale、Superb AI、Voxel51、Argilla、Snorkel AI、Aquarium Learning、Lightly、Tenyks
データアノテーション
AIや機械学習モデルの学習に備えて大量のデータのラベル付けサービスを提供する分野。テキストのアノテーションと、画像・映像のアノテーションがある。大半のベンダー(開発業者)はデータセットを人手で分類し、ラベル付けしているが、迅速化のためAIを活用した自動化ツールを提供する業者もある。
▽23年に入ってからのエクイティ調達額と件数:6500万ドル、3件
▽この1年の従業員数の増減:-39%
▽この分野の企業: Sama、CrowdWorks、CloudFactory、Scale、iMerit、SuperAnnotate、Hive、Superb AI、Centaur Labs、Flywheel、V7、Super.AI、Voxel51、Alegion、Edgecase、Dataloop、Snorkel AI、Synthetaic、Labelbox、Encord
合成学習データ―メディア
AIアルゴリズムの学習用にリアルな映像や画像を合成するプラットフォームを手掛ける分野。合成データは実際の映像や画像のデータが少ないか、入手しづらい場合に特に有用で、例えば悪天候での自動運転車の走行訓練などに使われる。さらに、プライバシーや規制の懸念に対処しながらAIアプリケーションを開発できる。
▽23年に入ってからのエクイティ調達額と件数:不明、2件
▽この1年の従業員数の増減:+10%
▽この分野の企業: Parallel Domain、Datagen、CVEDIA、Neurolabs、Mindtech、Zumo Labs、Anyverse、Bifrost、Sky Engine AI、Synthesis AI、Rendered.ai
合成学習データ―表とテキスト
患者のカルテや顧客の購買履歴などのデータセットの主要パターンを特定し、オリジナルデータの主な特性を保った匿名データセットを生成する分野。合成データの匿名性により、AIシステム開発・運用チームの安全かつ規制に対応した協業が可能になる。欧州連合(EU)の「一般データ保護規則(GDPR)」や「(米)カリフォルニア州消費者プライバシー法(CCPA)」などの規制に対応した質の高いデータの需要の高まりが、この分野を後押ししている。合成データを使えば、時間のかかる匿名化やラベル付け、マスキングも不要になる。
▽23年に入ってからのエクイティ調達額と件数:1100万ドル、3件
▽この1年の従業員数の増減:+7%
▽この分野の企業: Facteus、Tonic.ai、Statice、Synthesized、Diveplane、Ydata、Gretel、Sarus、Syntho、Replica Analytics、Syntegra、Hazy、Clearbox、Aindo、Betterdata、MOSTLY AI、Syntheticus
特徴量の保存&管理
機械学習の特徴量(分析対象データの特徴を表す値)や関連メタデータ(補足情報)をまとめて保存する場を提供し、AIチームが特徴量を共有し、定義の一貫性を確保できるようにする分野。こうしたツールにより、特徴量への容易なアクセスや再利用、一貫性を確保するための追跡が可能になる。さらに、生データをすぐに特徴量に変換し、AIアルゴリズムがリアルタイムで利用できるようにもする。
▽23年に入ってからのエクイティ調達額と件数:なし
▽この1年の従業員数の増減:+5%
▽この分野の企業: LaunchDarkly、Kaskada、Logical Clocks、Tecton、FeatureBase、dotData、Rasgo、Unleash
AI開発プラットフォーム
AIシステムを開発・展開しようとする企業向けのワンストップショップとして機能する分野。ベンダーは企業のモデル開発をトータルで推進するため、データの準備、学習、検証からモデルの展開、継続的なモニタリングまでAIのライフサイクルの全てを一つのプラットフォームで提供している。簡単で分かりやすい「ドラッグ・アンド・ドロップ」形式のインターフェースや、AIに関する深い専門知識がないチームでもAIシステムを簡単に構築できるツールを提供するベンダーもある。
▽23年に入ってからのエクイティ調達額と件数:8億3700万ドル、11件
▽この1年の従業員数の増減:+21%
▽この分野の企業: RapidMiner、Databricks、MakinaRocks、Scale、Hugging Face、Domino、Chooch、C3 AI H2O.ai、Iguazio、MindsDB、Abacus.AI、Dataiku、Lightning AI、MosaicML、Continual、Clarifai、DataRobot、4Paradigm
バージョン管理&実験の追跡
何千回も繰り返される機械学習の実験を自動で追跡、記録、比較し、AIチームの協業を可能にするツールを提供する分野。学習データやソースコード(プログラム)、モデルの変数の変更を記録し、機械学習に関連する全てのメタデータを追跡する。データのバージョン管理(AIの実験で使われたデータの変更の追跡)に主に力を入れているベンダーもあれば、エンド・ツー・エンドの実験管理を手掛けるベンダーもある。実験管理ツールを使うことで、AIの研究は再現可能になる。これは監査可能で説明可能なモデルの構築に必要だ。
▽23年に入ってからのエクイティ調達額と件数:5000万ドル、1件
▽この1年の従業員数の増減:+6%
▽この分野の企業: Pachyderm、Comet、Weights & Biases、Neptune Labs、Verta、Iterative、Polyaxon、DoltHub、Guild AI、VESSL AI
ハードウエアに応じたAI最適化
GPU(画像処理半導体)やCPU(中央演算処理装置)など利用可能なハードウエアで効率的に稼働するよう、AIアルゴリズムやモデルを最適化するソフトウエアを提供する分野。ニューラルネットワークを圧縮し、エッジ(末端)デバイスやオンプレミス(自社所有)のサーバーで稼働できるようにする。これによりAIの展開を加速し、予測遅延を減らし、モデルの性能を向上できる。
▽23年に入ってからのエクイティ調達額と件数:なし
▽この1年の従業員数の増減:+22%
▽この分野の企業: Neural Magic、Run:AI、Latent AI、Nota AI、Deci、Deeplite、Edge Impulse
モデルの展開&供給
学習済みの機械学習モデルを本番環境で運用し、データサイエンスチームとDevOps(開発運用)チームをつなぐ分野。ベンダーはオープンソースソフトウエア「Kubernetes(クバネティス)」で機械学習を展開するツールや、クラウドやオンプレミス環境でのAI展開に使えるサーバーレス技術を提供している。大半はモデルの継続的なモニタリングとガバナンス(統治)ツールも手掛ける。
▽23年に入ってからのエクイティ調達額と件数:2900万ドル、2件
▽この1年の従業員数の増減:-7%
▽この分野の企業: Seldon、Arrikto、OctoML、Modzy、Datatron、VESSL AI
アルゴリズム監査&リスク管理
アルゴリズムの意思決定に伴うリスクを評価し、軽減するツールを提供する分野。これによりアルゴリズムの公正さや透明性を確保し、規制を順守できるようにする。この分野のベンダーはデータの監査、モデルの検証、メタデータの追跡、本番活用後のモニタリングなどAIのリスクを軽減する多面的なアプローチを採用している。
▽23年に入ってからのエクイティ調達額と件数:100万ドル、2件
▽この1年の従業員数の増減:+22%
▽この分野の企業: ModelOp、Chatterbox Labs、TrojAI、Armilla AI、Saidot、Credo AI、anch.AI、ORCAA、Themis AI、QuantPi、Holistic AI
モデルの検証&モニタリング
AIモデルの性能を継続的にモニタリングし、モデルの挙動をリアルタイムで可視化する策を提供する分野。予測での異常値や偏っている可能性がある結果、敵対的攻撃の疑いを追跡する。AIモデルは学習データと大きく異なる実世界データにさらされ続けると性能がいずれ低下する可能性があることが、この分野の需要の背景にある。
▽23年に入ってからのエクイティ調達額と件数:2000万ドル、3件
▽この1年の従業員数の増減:+13%
▽この分野の企業: Wallaroo、Seldon、Fiddler AI、Vianai Systems、Arthur、Arize、Superwise、TruEra、WhyLabs、Robust Intelligence、NannyML、TrojAI、LatticeFlow、Etiq AI、Datatron、Aporia、Evidently AI、Yields.io、Censius
機械学習のセキュリティー(MLSec)
敵対的攻撃やデータ汚染、モデルの回避攻撃、バックドアの設置などのサイバー攻撃から機械学習のモデルやアルゴリズムを守る手段を提供する分野。ベンダーは侵入検知システム、防御システム、安全な機械学習フレームワーク、異常検知ツールなど様々な製品を提供している。
▽23年に入ってからのエクイティ調達額と件数:1億900万ドル、4件
▽この1年の従業員数の増減:+24%
▽この分野の企業: Hidden Layer、Kobalt Labs、Calypso AI、Arthur、WhyLabs、TrojAI、Protect AI
関連企業・業界