この記事のポイント
- Deep Researchは、複雑な調査を自動化するOpenAIの新しいエージェント機能
- 人間が数時間かける調査を数十分で完了
- 専門家レベルのタスクでも高い性能を発揮
- Humanity's Last Examで26.6%、GAIAで平均67.36 (pass@1)、72.57 (cons@64)を記録
- 現在はProユーザーが利用可能、今後PlusおよびTeamユーザーにも提供予定
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
OpenAIが開発したDeep Researchは、複雑な調査タスクを自動化する革新的なAIエージェントです。人間が数時間かける調査を数十分で完了し、専門家レベルのタスクにおいても高い性能を発揮します。
本記事では、このDeep Researchの概要、機能、使い方、性能、そして今後の可能性について、詳細に解説します。
目次
OpenAI Deep Researchとは
Deep Researchは、OpenAIが開発した新しいエージェント機能です。
ユーザーが与えたプロンプトに基づき、インターネット上の膨大な情報から関連する情報を見つけ出し、分析、統合して包括的なレポートを作成する、いわば「リサーチアナリスト」のようなAIです。
https://www.youtube.com/live/jv-lpIsnLOo?si=1Clroa-39VxKr4Oy
従来の調査手法では、人間がキーワードを駆使して検索エンジンで情報を探し、複数のウェブサイトを閲覧し、必要な情報を取捨選択し、それらを統合してレポートを作成する必要がありました。
このプロセスには、多くの場合、数時間から数日、場合によってはそれ以上の時間と労力を要します。
Deep Researchは、この一連の調査プロセスを自動化し、大幅に効率化します。
ユーザーは、ChatGPT上で「Deep Research」を選択し、クエリを入力するだけで、あとはAIが自動的に調査を実行してくれます。
Deep Researchの仕組み
Deep Researchは、ブラウザやPythonツールの使用を必要とする実世界のタスクで、強化学習を用いてトレーニングされています。
このトレーニングを通じて、Deep Researchは、多段階の調査タスクを実行するための計画と実行方法を学習しています。
また、Deep Researchは、Webブラウジングとデータ分析に最適化された設計がされています。
Deep Researchの主要機能
Deep Researchの主要な機能は、以下の通りです。
多段階の調査タスク実行能力
Deep Researchは、単一のクエリに対して、複数のステップを踏んで調査を実行します。
例えば、「ストリーミングプラットフォームにおける競合分析」を依頼した場合、まず競合他社を特定し、それぞれの企業の強みや弱みを分析し、それらを比較してレポートにまとめる、といった一連の調査タスクを自動的に実行します。
推論による情報統合と分析
Deep Researchは、単に情報を収集するだけでなく、それらの情報を推論によって統合し、分析します。
複数の情報源から得られた情報を照らし合わせ、矛盾や関連性を発見し、そこから新たな洞察を導き出すことが可能です。
多様なデータソースへの対応
Deep Researchは、ウェブ上のテキスト、画像、PDFなど、多様なデータソースから情報を収集することができます。
将来的には、より専門的なデータソースへのアクセスも期待されます。
明確な引用と根拠の提示
Deep Researchが作成するレポートには、情報の引用元が明確に示されます。
また、結論に至った推論のプロセスも提示されるため、ユーザーは結果の妥当性を検証することができます。
OpenAI Deep Researchの料金
Deep Researchは現在、ChatGPT Proに加入してるユーザーのみ利用可能です。
今後は、Plus、Team、Enterpriseプランユーザーへの提供も予定されています。
また、近いうちに、より高速でコスト効率の高いバージョンがリリースされ、より多くのユーザーが高いレート制限で利用できるようになるとのことです。
Deep Researchの使い方
-
チャット入力欄下部の「Deep Research」を選択します。
-
調査してほしい内容をクエリとして入力します。例えば、「最高の通勤用自転車に関するパーソナライズされたレポート」など、具体的な要望を記述します。
-
実行が開始されると、サイドバーが表示され、実行された手順と使用されたソースの概要を確認できます。
リサーチにかかる時間は5分~30分程度で、リサーチが完了すると通知が届きます。
Deep Researchの性能
Deep Researchは、専門家レベルのタスクにおいても高い性能を発揮することが確認されています。
専門家レベルのタスクにおける評価
ドメインの専門家による評価
さまざまな分野の専門家による内部評価では、Deep Researchは人間が数時間かけて行うような複雑な調査タスクを自動化できることが確認されています。
*グラフに基づく分析
さらに、Deep Researchの性能は、割り当てられる計算リソースや推論時間が増えるほど向上することも確認されています。
つまり、モデルに「考える時間」を十分に与えることで、より複雑な問題に対しても、より精度の高い結果を導き出せるのです。
この特性は、Deep Researchが、より難易度の高い調査や、より深い分析を必要とするタスクにも対応できる可能性を示唆しています。
ベンチマーク結果
Deep Researchは、AIの性能を客観的に評価するためのベンチマークテストにおいても、優れた結果を残しています。
Humanity's Last Exam
このベンチマークは、人間には容易でもAIには難しいとされる多様な分野の専門知識を問う問題で構成されており、AIが真に人間レベルの知性を獲得しているかを測る試験とされています。
Deep Researchは、このHumanity's Last Examにおいて、26.6%の精度を達成し、従来の最高記録を大幅に更新しました。
GAIA
GAIAは、現実世界の問題解決能力を評価するベンチマークです。
Deep Researchは、このベンチマークにおいて、平均スコア67.36 (pass@1)、72.57 (cons@64)という高いスコアを記録し、新たな最高水準(SOTA: State-of-the-Art)を達成しました。
これらのベンチマーク結果は、Deep Researchが、抽象的な問題解決能力だけでなく、現実世界の複雑な課題にも対応できる、汎用性の高いAIであることを示しています。
Deep Researchの今後の展望
Deep Researchは、現在ウェブ上の情報やユーザーがアップロードしたファイルにアクセスできますが、将来的には、科学論文データベースや企業データベースなど、より専門性の高い情報源へのアクセスが可能になることで、調査の精度と専門性がさらに向上すると考えられます。
また、サブスクリプションベースのリソースや内部リソースへのアクセスも拡大する予定です。
Deep Researchの活用事例
※近日公開予定
まとめ
OpenAIのDeep Researchは、複雑な調査タスクを自動化する革新的なAIエージェントです。多段階の調査を、人間が数時間かかるところを数十分で完了し、専門家レベルのタスクにおいても高い性能を発揮します。この技術は、今後、様々な分野で活用され、人間の知的生産性を大幅に向上させることが期待されます。Deep Researchは、AIによる調査のあり方を根本から変える可能性を秘めており、今後の発展から目が離せません。