大手テック企業は、人間のユーザーに代わって自律的にアクションを実行し、複数のステップからなるタスクを完了することができる「エージェント的なAI」に取り組んでいる。
Andriy Onufriyenko/Getty
- 生成AIという言葉は聞いたことがあるかもしれないが、「AIエージェント」はあまり馴染みがないかもしれない。
- 業界の主要企業は、AIの第3の波と言われるAIエージェントに取り組んでいる。
- しかし、エージェント的なAIとは一体何なのだろうか?ここでは、テック界で話題になっている技術を簡単に説明しよう。
生成AIはしばらく前から話題のテクノロジーになっているが、ビジネス系のポッドキャストを聞いていると、「エージェント的(agentic)」AIという別の言葉が飛び交っているのを耳にするだろう。
これは生成AIと何が違うのだろうか。
この2つは密接に関連している。生成AIがなければ、AIエージェントはあり得ない。定義はさまざまだが、一般的に、エージェント(代理人)のようにふるまい、ユーザーに代わって複雑なタスクを自律的に実行できるAI技術のことを言う。
AIエージェントに取り組んでいる企業によると、いずれはAIエージェントを、ヘルスケアやサプライチェーン管理、サイバーセキュリティ、顧客サービスなどの分野で、人間の労働者にとってのデジタルな同僚やアシスタントにすることを目指しているという。
大手テック企業は、AIエージェントの概念を次のように説明している。
- エヌビディア(Nvidia):「高度な推論と反復的な計画を用いて、複雑な多段階の問題を自律的に解決する」
- IBM:「『主体性のある』システムやプログラムであり、意思決定を行い、行動を起こし、複雑な問題を解決し、システムの機械学習(ML)モデルで学んだデータを超えて外部環境と相互作用する」
- マイクロソフト(Microsoft):「単純なチャットボットからコパイロット、高度なAIアシスタントに至るまで、複雑なワークフローを自律的に実行できるデジタルまたはロボットシステムの形態を取る」
この分野のリーダーたちは、AIエージェントがAIの新たなフロンティアを切り開いていると述べている。
「わずか数年の間に、我々はすでに3世代のAIを目の当たりにした」と、セールスフォース(Salesforce)のマーク・ベニオフ(Marc Benioff)CEOは12月初旬、ニューヨーク・タイムズに語った。
「最初はデータを分析する予測モデルが登場した。その次は、ChatGPTのようなディープラーニングモデルを搭載した生成型AI。今、我々は第3の波、すなわち複雑なタスクを自律的に処理できるインテリジェントエージェントを体験している」
セールスフォースは、2024年初頭に自律型AIエージェントのスイート「Agentforce」を発表し、2025年末までに10億以上のAIエージェントが企業で使用されるようになる計画だと述べた。
グーグル(Google)のスンダー・ピチャイ(Sundar Pichai)CEOは先ごろ、同社が「この1年間で多くのエージェント型モデルの開発に投資してきた」と述べた(彼はAIエージェントを「周囲の世界について多くを理解し、複数のステップを先読みして、ユーザーの監視のもとでユーザーの代わりに行動を起こすことができる」と定義している)。同社は12月にGemini 2.0を発表した際、AIエージェント機能に焦点に当てた。
OpenAIは、2025年1月に「オペレーター」というコードネームのAIエージェントを発表する予定だ。このエージェントは、コードを書いたりフライトを予約したり、ユーザーの代わりにコンピュータを使ってさまざまな作業を行うことができるという。11月にブルームバーグが関係者2名の話として報じた。OpenAIは、12日間にわたって新しい製品や機能の発表を行うイベント「Shipmas」の最終日となった12月20日に、最新のAIモデル「o3」を発表した。