行動モデルの新理論発表:バイエス法での統合的アプローチ
2024年6月19日、Microsoft Research Asiaおよび沖縄科学技術大学院大学の研究者たちは、生物と人工知能(AI)エージェントの行動を統合する新理論を発表しました。
この理論では、従来別々に考えられていた「習慣的行動」と「目標指向行動」を一つに統合しています。
習慣的行動(例:仕事に集中しているときに間食を食べる)と目標指向的行動(体重を減らすために食事を計画する)
これを実現するために、統計技術であるバイエス法(バリエーションベイズ法)を用いて、新しい証拠に基づいて信念や確率をアップデートする方法を取り入れています。
この理論の核となるのは「ベイジアン行動フレームワーク」という概念で、習慣的行動と目標指向行動をつなげる役割を果たします。
習慣的行動は、明確な目標ではなく感覚的手がかりによって形成された意図の分布によって推進され、目標指向行動は特定の目標に基づいて条件付けられた意図の分布に導かれます。
この統合的アプローチは、行動の正確性と柔軟性のバランスを取りながら、エージェントが環境と効果的に関わることを可能にします。
AIと生物学に革新:シミュレーション実験とその結果
この新しい理論は、視覚ベースのセンサーモータータスク、特にT字型迷路環境でのシミュレーションを通じてテストされました。
研究結果は、神経科学や心理学の実験で観察された現象を再現しました。
エージェントの行動は、繰り返しトライアルを経ることで、遅く目標指向の行動から速い習慣的行動へと自然に移行します。
また、報酬の価値が変化した際の行動変化にも対応し、訓練を積んだエージェントは行動変化への抵抗力を示し、習慣的行動の堅牢性を反映しています。
さらに、追加のトレーニングなしで新しい目標に対する計画を立て、実行する能力(ゼロショット目標指向計画)も実証しました。
これらの結果は、生物とAIのエージェントが、柔軟かつ効率的な行動を実現するためのメカニズムを理解する上で重要な洞察を提供します。
(a)ベイズ行動フレームワークの概要。(b)と(c):学習と行動の枠組みの図。
AIとロボティクスへの応用:より効率的な自律システムへ
この研究は、理論的なモデリングを超えて実用的な意味合いも持ちます。
機械学習とAI分野では、このフレームワークがより効率的で適応性の高いシステムの設計に役立ちます。
例えば、強化学習とアクティブ推論を組み合わせることで、複雑な環境における自律エージェントの意思決定能力を高めることができます。
この理論は、認知科学とAIの文脈における行動の理解を進化させ、効率と柔軟性を両立する包括的なモデルを提供します。学術的な知見を進めるだけでなく、AIやロボティクスの実用的な応用に向けた新たな洞察も提供しています。
この研究はMicrosoftの広範なAIイニシアティブを支え、イノベーションに向けた多分野にわたる取り組みを強調しています。
出典:Microsoft