この記事のポイント
- この記事はAIエージェントの能力とその影響について詳しく紹介しています。
- AIエージェントは、人間主導からエージェントによる実行までのレベルを持ったAIシステムです。
- エージェントの能力はスペクトル上に存在し、シンプルなタスクから高度な自律システムまで多岐にわたります。
- エージェント的能力の高度化には、新しいツールやインフラが不可欠です。
- 開発の効率と堅牢性の向上には、エージェント的能力の理解が重要です。
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
AIエージェントとは、一体どれほど多様な形で私たちの日常やビジネスシーンに影響をもたらしているのでしょうか?
大規模言語モデル(LLM)を用いたAIエージェントの自律性のレベルには、人間主導からエージェント自身による実行まで、多様なステージが存在します。
本記事では、LangChainのハリソン・チェイス氏による独自の定義から、各ステージの特徴やそれに対応する新たなツールとインフラまで、これからのAI技術活用に不可欠な情報を詳しく解説していきます。
AIエージェントの「エージェント的」能力とは?
AIエージェントに関する新たな考察が話題となっています。
以下の図は、LLMアプリケーションにおける自律性のレベルを示しており、人間主導(HUMAN-DRIVEN)からAIエージェントによる実行(AGENT-EXECUTED)まで、6段階のレベルが描かれています。
LLMにおける自立性レベル
LangChainのハリソン・チェイスは、AIエージェントを「大規模言語モデル(LLM)を用いてアプリケーションの制御フローを決定するシステム」と定義しています。
一般的な見解では、エージェントは自律的で高度な機能を持つとされる一方で、チェイスは「エージェントの能力をスペクトルと捉えるべきだ」と提案します。
エージェント的な能力は、単純なものから複雑な自律システムに至るまで幅広く存在するということです。
例えば、図のレベル2(LLM Call)のように、「LLMを使用して入力を特定のワークフローに割り当てるシンプルな行動」も、ある程度「エージェント的」な行為と言えます。
また、レベル3(Chain)のような「複数のLLMが連鎖的に処理を行うシステム」や、レベル5(State Machine)のように「一連のステップを記憶し、それを基に動作するシステム」等、エージェント的行為のレベルは様々です。
エージェント的能力がプロジェクトにもたらす影響
AIエージェントの「エージェント的」能力のスペクトルを理解することで、開発プロセスの効率と堅牢性を向上させることができます。
図に示されたレベル1(Code)から徐々にレベル6(Autonomous)に移行するにつれて、システムの複雑さと必要なインフラストラクチャーが増加します。
例えば、レベル4(Router)以上になると、複雑な分岐ロジックに対応できる「オーケストレーションフレームワーク」(統合制御の仕組み)が不可欠となります。
また、エージェント的システムは実行が難しく、タスク完了までに時間がかかることが多いため、バックグラウンドでの耐久性のある実行が求められます。
その上で、システムとのインタラクティブな相互作用や、評価フレームワーク、監視フレームワークの必要性も高まります。
これらは、ランダム性が多いために複数回の評価実行を必要としたり、エージェントが取るステップを詳細に監視したり、クエリしたりする能力が求められるためです。
エージェント的システムのための新たなツールとインフラ
エージェント的な能力が高いアプリケーションほど、新しいツールやインフラが重要になります。
各レベルに対応するツールや技術の例として、以下が挙げられます。
レベル2(LLM Call): シンプルなLLM APIラッパー
レベル3(Chain): LangChainのような連鎖的処理フレームワーク
レベル4-5(Router, State Machine): LangGraphのようなワークフロー管理ツール
レベル6(Autonomous) 高度な自己改善や学習能力を持つAGI(汎用人工知能)システム
ハリソン・チェイスは、LangChainが「エージェントのオーケストレーションのためにLangGraphを構築したこと」、また「LLMアプリケーションのためのテストおよび可観測性プラットフォームであるLangSmithを開発したこと」を例に挙げています。
これらのツールは、エージェント的スペクトルを一層進めるために役立ちます。
LLMの時代には不足していた機能を補い、より複雑なエージェント的アプリケーションのサポートを可能にするための、再想像されたエコシステムが求められているのです。
エージェント的能力のレベルに応じた新しいテクノロジーの導入は、未来のAIエージェント開発におけるキーとなります。
出典:LangChain