この記事のポイント
- この記事は、MIT CSAILによる自然言語を活用した大規模言語モデルの性能向上について述べています。
- MIT研究者はLILO、Ada、LGAという言語理解を強化する三つのフレームワークを開発しました。
- AIに自然言語記述を使うことで、より複雑な問題解決能力を高めることが可能となります。
- 航空宇宙工学の部門長Julie Shahらがシニア著者として各論文に関与しています。
- この研究は人工知能の分野で注目され、さまざまな機関から資金提供を受けています。
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
コンピュータサイエンスと人工知能の発展において、自然言語を活用することが、AIの性能向上に重要な役割を果たしています。
MITの研究チームは、自然言語を用いてAIがより複雑なタスクを効果的に解決するアプローチを開発しました。
リファクタリングを行うLILO、多段階タスクを計画するAda、ロボティクスナビゲーションに焦点を当てたLGAという三つのフレームワークを通じて、AIが人間に近い常識的な知識を学び、柔軟な計画を立案する力を高めています。
本記事では、それぞれのフレームワークの概要とともに、こうした技術革新がAIの未来にどのようなインパクトをもたらすかを探ります。
自然言語がAIの性能向上に貢献
MITのコンピュータサイエンスと人工知能研究所(CSAIL)の研究者たちは、AIの性能向上に向けて、自然言語を使ってAIの理解を深める方法を開発しました。
自然言語は、AIが複雑なタスクを解決するための抽象概念を学ぶのに役立ちます。普段私たちが使っている言葉は、コード合成、AI計画立案、ロボティクスナビゲーションなどのタスクでAIにとって豊富なコンテキストを提供します。
このようにして、AIは複雑な問題に対応するためのより良い全体的な表現を構築できるようになります。
MIT研究、言語モデルを革新
MITの研究者たちは、LILO(言語観察からのライブラリ誘導)、Ada(アクションドメイン獲得)、LGA(言語ガイド付き抽象化)という3つのフレームワークを開発し、プログラミング、AI計画、ロボット工学のタスクにおける言語モデルのパフォーマンスを向上させました。
これらは、人間のようなニューラルネットワークとプログラムのような論理的要素を組み合わせたニューロシンボリック手法です。LILOは、標準的な言語モデルを使用してコードを書き、Stitchというアルゴリズムで抽象概念を見つけ、それらを文書化したライブラリ内にまとめることで、プログラムのリファクタリングを行います。
これにより、より人間に近い常識的知識が必要なタスクをこなすことができるようになります。
コーディングとロボットに新手法
Adaフレームワークは、AIが多段階のタスクを自動化する際に、自然言語のプラン記述を利用します。
これにより、AIがより柔軟な計画を立案できるようになります。Adaは、潜在的なタスクとそれらの自然言語による記述を学習し、言語モデルがこのデータセットからアクションの抽象概念を提案します。
LGAは、ロボットが人間のように環境を解釈し、不要な詳細を省略しながらタスクを実行するのを助ける方法を提供します。
これらのフレームワークは、AIがより人間らしいタスクを理解し、実行するためのステップとなります。
AIと自然言語の融合進む
これらの研究は、AIがより人間らしいパフォーマンスを示すための新たな道を切り開きます。LILO、Ada、LGAは、自然言語と記号論理を組み合わせており、AIにとってより解釈しやすいコードや行動計画を生み出します。
AIがより複雑な問題や環境に対応するための理解を深めることができるため、将来的には、より人間に近いAIモデルの開発につながる可能性があります。
MIT CSAILのメンバーは、各論文のシニア著者として、脳と認知科学の教授Joshua Tenenbaum(LILOとAdaの両方)、航空宇宙工学の部門長Julie Shah(LGA)、および電気工学およびコンピュータサイエンスの准教授Jacob Andreas(3つすべて)が務めています。
LILO、Ada、LGAでAIを強化
LILO、Ada、LGAは、それぞれがAIの特定の分野に焦点を当てた高度な技術です。LILOはプログラムのリファクタリングを通じて、より洗練されたコードのライブラリを生成します。
Adaは、自然言語記述を使ってAIエージェントがタスクを計画できるよう支援します。一方、LGAは、ロボットが環境の重要な要素に焦点を当てて、人間に対する手助けをより効率的に行うことを可能にします。
これらの技術は、国際学習表現会議で発表され、人工知能の分野における新しいフロンティアとして期待されています。
研究資金は、米国空軍科学研究局、米国国防高等研究計画局、米国海軍研究局、および脳、心、機械のセンターなど、複数の機関から提供されています。
出典MIT