LayerX エンジニアブログ

LayerX の エンジニアブログです。

進化を続ける知性の時代と、エージェントの先、2025年に向けて

この記事は~LayerXテックアドカレ2024~の25日目の記事です。

先日の生成AI忘年会2024というイベントで、Sakana.aiの秋葉さんやLINEヤフーで生成AIを担当される宮澤さんとパネルディスカッションでご一緒させていただいたのですが、その中で象徴的な話題が飛び出しました。それは「LLM(Large Language Model)の知性が、もはや人間の判断可能な性能を超える可能性を帯びつつある」という点と、その先にある未来についてです。もはや“使えるかどうか”の次元を超えたLLMが登場するなかで、われわれがどう向き合い、どう応用していくべきなのか。その議論は、自分にとっても聞きに来てくださった方々にとっても、来年に向けたAI活用の方向性を考えるよい刺激になったように思います。

その話も踏まえつつ、来年について書いてみようかと思います。

o1以降の知性の進化の衝撃

2024年中盤以降、生成AI界隈ではOpenAIのo1シリーズが大きな注目を集めています。従来のLLMとは一線を画し、「推論のために費やす時間」という要素を追加し、新たなパラダイムを導入している点が特徴的です。これは、ただ文章を生成するだけでなく、“複数ステップの推論”や“問題の背景を深堀りして論理的な道筋を組み立てる”ことが得意なモデル設計となっています。具体的には、これまでのGPTシリーズができなかった、より複雑で多段階な推論を要する問題への対応力が格段に高まり、回答の精度や網羅性も進化しています。

私自身、今年はエンタープライズ向けSaaSの開発を進めるなかで、複数のLLMを比較検証する機会が多くありました。その中でも、o1モデルが示す新たな可能性は非常に刺激的です。処理スピードも改善し、さらに論理的推論能力も高いこのモデルは、単に「文章をうまくまとめる」だけでなく、ビジネスの複雑な要件や制約を踏まえた上で合理的な解を導くことに向いています。いわば、優秀な専門家が課題を深掘りするように、解決策の全体像を提示することが可能になったのです。

さらにここで見落とせないのは、LLMの性能とコストが同時に進化している事実です。o1シリーズのように高精度・高推論力なモデルが増える一方で、ベースラインとなるLLMも世界的な競争の波にさらされ、日進月歩で“安く”なり続けています。大規模クラウドベンダーや研究機関が相次いで高性能モデルをオープンソース化し、さらに小型化・最適化の波も押し寄せているため、非常に安いコストで「そこそこの知性」が利用できるようになりました。

一方、「そこそこの知性」を安価に得られるだけでなく、「深い知性」を使いこなす方法も同時に拡充していく段階に来ています。少し極端にいえば、元々のLLMでは難しかった複雑なドキュメントや手順を扱う専門領域であっても、パラメータを増やすだけでなく推論に十分な時間を確保すれば突破できるかもしれない。それほどまでにAIが高性能化する未来がすぐ手の届くところまで来ているのです。

しかし、この「深い知性」を実際の業務に落とし込むには、問題設定や独自の業務知識を手渡す仕組みが欠かせません。LLMは、「ものすごく優秀だけれど、社内の内部ルールを知らない新人」なのだと、最近何度か例えとして話しています。いわゆる「AIオンボーディング」の重要度が飛躍的に増している背景には、「新たな知性」に人間がどう向き合うかという、極めて根本的な問いが潜んでいるわけです。

LayerXとしての私たちのミッションは「すべての経済活動のデジタル化」です。そのために、経理分野向けSaaS バクラクをはじめ、アセットマネジメントや証券といった領域でデジタルサービスを立ち上げてきました。その根幹にはAIの特性を理解しよりよいAI-UXを生み出すことで実現してきたものになります。今後はますます高精度化・大規模化するLLMをどのように業務へ組み込み、人間の想像力・創造力を解き放つかが大きなテーマとなります。安くなる知性を最大限に活用し、新規事業やサービス開発へと転用する試みが次のステージに入っていくものと思っています。

o1モデル登場以降、o3なども含め高度な知性が活用可能になるであろう2025年には、特にLLMベースでさらなるサービスの進化を目指すことが死活問題になるものと考えています。SaaS体験の根本が書き換わる時代がじわりじわりと来ています。LLMはもはやいつか誰でも使えるようになる安価な知性になっていくと思われます。この流れの中でLLMベースの新たなアプローチに漕ぎ出していく必要があります。

AIオンボーディングと、来年以降のアプローチ

では、具体的にどのようにしてLLMをプロダクトへ導入し、その能力を最大限に引き出すのでしょうか。大事なキーワードとなるのが「AIオンボーディング」です。これは、LLMに求める役割やゴールを明確化し、そのために必要となる専門知識や社内の情報資産、さらには業務の方法を適切に提供するプロセスを指します。

note.com

たとえば、税制や規制の要件が多岐にわたる経理フローの自動化を考えるとしましょう。LLMは膨大な条文や過去の事例を瞬時に参照しながら推論できますが、企業固有の運用ルールや承認フローなどは標準データセットには含まれていません。そこで、オンボーディングとして「自社固有のバリデーションルール」「履歴から得られたナレッジ」「実務担当者が暗黙知として持っている優先度や例外処理」を、LLMが理解できる形式でわたす必要があるのです。

たとえo3以降、各社で知性の進化が続いたとしても、モデルの外部、つまり我々やその仕事内容にアクセスする手段がなければ、我々のPromptスキルに依存した仕事しか出来ません。我々より賢いモデルだからこそ、外部から様々な業務知識やツールを提供する必要があります。

重要なのは「問題設定」そのものをきちんと構造化すること。AIが処理しやすい形式に問題を落とし込まなければ、どれだけ賢いモデルでも適切に働いてはくれません。この手段としてはワークフローやエージェントといった仕組みが欠かせません。

今年6月にはこのAIオンボーディングを実現するためのプロダクトの第一弾として「Ai Workforce」をリリースしました。ワークフローエンジンを通じて業務フローを定義し、LLMを業務に効率的に組み込むことを可能にしています。LLMが人と同じように業務に取り掛かることで、これまで難しかった人手による作業領域において、業務効率化や知識活用を提供します。

また、今後三井物産デジタル・アセットマネジメントにて、重い金融領域で進めていく新たなデジタル化のプロジェクトもあります。「LLM時代の新しいアセマネ会社・証券会社」のあり方を探すタイミングが来たと考えています。書類のOCR化やRAGのような取り組みを超えて、LLMに業務プロセスの一員となってもらうための、重要書類のドラフト作成や規制に沿った業務の一次レビューなどを実現しようと考えています。ちなみにこれらもAi Workforceと独自のLLMプロダクトの開発の組み合わせで実現していきたいと考えています。

2025年、エージェントの年とは言うけれども…

これらの取り組みの中で、エージェントは一つ面白い取り組みになると思いますし、また世界的に各所が来年はエージェントの年になる、という風に言われています。

エージェントとは、人によって若干解釈のブレはあるものの、「環境に合わせて自律的に意思決定をして目的を遂行するプロセス」であると考えています。大まかには、エージェントの考え方・方針を示すトピック、過去のデータやマスターデータなどを備えたナレッジデータベース、そして、エージェントが利用可能なツール群から構成されています。ユーザーのリクエストに対してトピックに沿ってタスク方針を推論し、ツールやナレッジを選択し実行、結果をさらに次の処理に回して…と繰り返すような処理が主なエージェントの仕組みなっています。

これらを構築するツールについては、LanggraphやAutogen等のフレームワーク、Dify等のPlatformが普及しつつあります。個人的には重い業務領域では自前で構築することをおすすめしますが、LanggraphやDifyはエンジニアが簡単なツールを作るには便利ですね。

エージェントは非常に面白い技術である一方で、特定の新技術要素を重視しすぎることについては注意すべきかもしれません。過去も何度もそうした行き過ぎは有りました。新技術に取り組む上では、ただ盲目的に使うのではなくその技術の限界を知る必要があります。

エージェントは、自律的に意思決定をすることの積み上げで要望に答えるプロセスです。一方でこの意思決定を行うLLMには、未だそれなり以上の不正確な応答の確率があります。例えばそれがたとえ5%であっても一回のプロセスで10回の意思決定があればどこかで1回は失敗することがそれなりに発生します。手元で遊んでいる分には面白いのですが、業務アプリで20%以上失敗するツールは相当にフラストレーションが溜まるかもしれません。

Reasoning性能は向上していき、こうしたエラーは減りますが、自身の取り組みがどれほどのエラーを許容するのかはモデルの性質と合わせて検証しつつ利用していく必要があります。こうした現実と向き合って、エージェントだけでなくワークフローや既存のWebUIなど、使える限り様々な手段を駆使して自身のサービスのAI-UXをいかに作っていくか、LLMが上手く動き回れるAIオンボーディング的な取り組みをしていくことが2025年のテーマになるのではないでしょうか。

大企業との取り組みの中で

幸いなことに、2024年時点でAgentやその他LLMの活用方向性について様々なチャレンジの機会をいただくことができました。それも、銀行や商社といった日本を支える非常に大きな産業の中で、LLMベースのプロダクトを立ち上げてのチャレンジでした。この1年の学びを通して実際に産業の中で使われるLLMベースなプロダクトとはなにか、その周辺に何が必要になるのか、ここには書けませんが様々なノウハウが生まれてきました。

エージェントだけでなくワークフローやナレッジ管理、その他人と協働しともに成長するAI Platformであり続けるために2025年は様々な新機能を構築しつつ、さらには様々な業界それぞれのデジタル化を加速する新プロダクトなども検討していこうと考えています。

さらにバクラクやその周辺にもLLMをコアにした取り組みがスタートしようとしています。私の方では新規事業としてAi Workforceをつくっていますが、それとは別にCEOの福島とVP of Enablingの名村の方でも新たなプロダクトを進めています。

2025年、LLMに関連するチームを拡大し、さらに多くのプロジェクトに対応できる体制をつくっていく予定です。どんなことが可能になっていくのか、お客様との関係上ここでは言えないことが多いのですが本当にワクワクしています。もしこのブログを読んでくださっている方の中に、「LLMを実務に生かし、社会の複雑な課題にチャレンジしたい」「LayerXのビジョンに興味があり、AI×SaaSの未来をともに作りたい」という方がいらっしゃれば、ぜひお声がけください。

私たちが目指すのは、テクノロジーの可能性を最大限に探求し、仕事や暮らしの中に残るあらゆる摩擦を解消し、人々の創造力が最高潮に発揮される社会を実現することです。AIオンボーディングは、そのための基盤を築くうえで不可欠な一歩だと確信しています。

適切な環境と問題設定を与えれば、その知性は私たちの想像をはるかに超える解決策を提案してくれる、そんな知性の力を最大限引き出すために何が出来るのか。来年も引き続き、LayerXはこの“新たな知性”を業務や事業にどう活かし、経済全体をアップデートしていくかを、挑戦の軸として据えていきます。皆さんとともに、ここから先の未来を切り拓いていけることを楽しみにしています。

jobs.layerx.co.jp

open.talentio.com