この記事のポイント
CodexはChatGPT内で動作するAI開発エージェント
codex-1モデルを搭載し、高精度なコーディングが可能
AGENTS.mdによりプロジェクト特化型の指示が可能
Codex CLIはローカルでの軽量作業に最適化

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
Codexは、OpenAIが提供するクラウドベースのソフトウェアエンジニアリングエージェントで、複数のコーディングタスクを自律的に実行します。
ChatGPT内から自然に利用でき、バグ修正やテスト生成、PR提案などを代行することで、開発者の生産性を大幅に向上させます。
本記事では、Codexの仕組みや使い方、CLI版との違い、搭載モデル「codex-1」の性能、安全性、導入事例まで詳しく解説します。
AI総合研究所では、企業のChatGPT導入支援を行っています。
お気軽にご相談ください。
目次
Codexとは?
Codexは、OpenAIが開発したソフトウェア開発支援向けのクラウドベースAIエージェントであり、クラウド・CLIの両方で使えるため、開発スタイルに合わせて柔軟に導入できるのが特徴です。ChatGPT内で動作し、コーディングに関するさまざまなタスクを自律的に処理します。
Codexイメージ 参考:OpenAI公式
このエージェントは、OpenAIの最新大規模言語モデル「codex-1」を搭載しており、バグ修正、機能追加、テスト作成、コードレビューの提案など、実際の開発現場で求められる作業を自動で実行できます。
【関連記事】
AIエージェント(AI agent)とは?その仕組みや作り方、活用事例を解説
Codexの主な機能とできること
Codexは、日常的なソフトウェア開発タスクを自動で処理する「AIエージェント」として設計されており、以下のような複数の作業を並行して実行できます。
バグ修正・コード生成・テスト作成の自動化
Codexは、自然言語で指示された要件に基づき、ソースコードのバグを特定して修正したり、新機能のコードを生成したりできます。また、テストコードの作成や、既存テストの実行・確認も自動で行います。
Pull Request(PR)の提案とレビュー支援
修正や新機能を加えたコードは、CodexがPRの形でまとめて提示します。PRには変更理由やテスト結果が含まれており、人間のレビュー作業を補完する形で活用できます。
AGENTS.mdによるコードベースのナビゲーション
リポジトリに設置されたAGENTS.md
ファイルには、テストの実行コマンド、標準的な開発ルール、重要なフォルダ構成などを記載できます。Codexはこれを読み取り、コードベースの理解と作業精度を向上させます。
コーディングスタイルの自動適応
Codexは、プロジェクトごとのコーディングスタイルや命名規則にも自動で適応します。これは、codex-1モデルが実際のPRや人間の好みに基づいて強化学習されているためで、可読性の高いコードを出力することができます。
ログ・出力による動作の可視化
各タスク実行時には、テスト結果やターミナルログが提示され、Codexの動作が透明な形で示されます。ユーザーはその内容を確認し、変更をローカル環境に適用したり、再修正を依頼したりできます。
Codexの料金
Codexは現在、OpenAIのChatGPTユーザーを対象に段階的に提供が進められており、クラウド版とCLI版でそれぞれ異なる価格体系や提供方法が設定されています。
ChatGPT上でのCodex提供状況
2025年5月時点で、Codexは以下のプランで利用可能です。
プラン | 提供状況 |
---|---|
ChatGPT Pro | 利用可能(リサーチプレビュー) |
ChatGPT Team | 利用可能 |
ChatGPT Enterprise | 利用可能 |
ChatGPT Plus | 近日中に提供開始予定 |
ChatGPT Edu | 近日中に提供予定 |
※現在は追加料金なしで利用可能ですが、正式リリース後は段階的にレート制限やオプション課金が導入される予定です。
Codexの使い方
Codexの仕組みと使い方
Codexは、ChatGPT上から直接アクセスできるAIエージェントで、1つ1つのタスクをクラウド上の独立した環境で実行します。ここではその仕組みと使い方を詳しく解説します。
ChatGPTからの起動方法
Codexは、ChatGPTのサイドバーから利用可能です。タスクを始めるには、ChatGPTのUI上で以下のような操作を行います。
- プロンプトを入力(例:「このバグを修正して」)
コード
ボタンをクリックしてタスクを割り当て- 必要に応じて
質問する
ボタンでリポジトリ内のコードに関する質問も可能
実行環境:クラウドサンドボックス
Codexがタスクを実行するのは、ユーザーのリポジトリが事前にロードされたクラウド上の隔離環境(サンドボックス)です。この環境では、以下のことが可能です。
- ファイルの読み取りと編集
- テストスクリプトやビルドコマンドの実行
- リンターや型チェッカーの実行
これらはプロジェクトに応じて1分〜30分ほどで処理され、結果がリアルタイムで表示されます。
AGENTS.mdによる高度な制御
リポジトリにAGENTS.md
ファイルを追加することで、Codexに以下のような設定を指示できます。
- テストを実行するための具体的なコマンド
- 使用すべきビルドシステムや依存関係
- プロジェクトの標準スタイルや命名規則
これは従来のREADME.mdに似た仕組みですが、Codexの動作指針として特化しており、エージェントの精度と信頼性を高める鍵となります。
実行結果の確認と次のアクション
タスクが完了すると、Codexは以下の情報を提示します。
- 修正内容の差分(diff)
- ターミナルログとテスト結果
- PRとして提案された場合はその要点
ユーザーは、内容を確認してPRをGitHubへ送信したり、ローカルに取り込んだり、さらなる修正を依頼することが可能です。
Codex CLIとは?ローカル環境での使い方
Codex CLIとは、ターミナル上で動作する軽量なコーディングエージェントツールです。CodexをChatGPTの外でも利用できるようにしたもので、手元の開発ワークフローに自然に組み込めます。
Codex CLIの特徴
Codex CLIは、OpenAIの小型モデル「codex-mini-latest(o4-miniベース)」を搭載し、以下の用途に最適化されています。
- ローカルのコードファイルを対象にしたQ&Aやコード生成
- シンプルなコード修正・補完の高速化
- スニペット単位のやり取りに最適な低レイテンシ設計
クラウド版Codexが複雑なタスクや大規模なリポジトリ向けであるのに対し、Codex CLIはローカルでの軽量作業に特化しています。
利用方法とアカウント連携
Codex CLIの導入は以下のように簡単に行えます。
- CLIツールをインストール(
npm
またはpip
経由) - 初回起動時に、ChatGPTアカウントでサインイン
- 使用する組織を選択すると、自動でAPIキーが設定される
これにより、手動でAPIトークンを生成・管理する手間が不要になりました。
無料クレジットと料金体系
Codex CLIユーザーは、ChatGPTのPlus/Proアカウントに応じて、以下の無料APIクレジットを利用可能です(初回のみ):
- Plusユーザー:5ドル分の無料クレジット
- Proユーザー:50ドル分の無料クレジット
また、codex-mini-latest
のAPI料金は次のとおりです。
トークン種別 | 単価(100万トークンあたり) | 備考 |
---|---|---|
入力トークン | $1.50 | キャッシュ適用前 |
出力トークン | $6.00 | 最大75%のキャッシュ割引あり |
※モデルはAPIのResponsesエンドポイント経由で使用され、今後も定期的なアップデートが予定されています。
Codexに搭載されたモデル:codex-1とは?
Codexに搭載されている「codex-1」は、OpenAIの第三世代大規模言語モデル「o3」をベースに、ソフトウェアエンジニアリングに特化して最適化されたモデルです。Codexの高精度なコード生成・レビュー・修正提案といった機能は、このモデルの能力によって支えられています。
【関連記事】
OpenAI o3(ChatGPT o3)とは?使い方や料金、制限について解説!
codex-1のトレーニングの特徴
codex-1は以下のような方法で開発されました。
- 強化学習(RLHF)によるチューニング:人間の好みに合ったコードスタイルやPR提案形式を学習
- 現実の開発タスクに基づく微調整:社内外の実際のPull Request、テスト、バグ修正を学習対象に含む
- 高精度な反復試行処理:タスク完了までコードを生成・実行・修正するサイクルを複数回自動で行う能力を持つ
これにより、codex-1は一般的な言語モデルと異なり、「テストに合格するまで修正を繰り返す」ようなエンジニア的な動作ロジックを内在しています。
【関連記事】
RLHF(人間のフィードバックによる強化学習)とは?仕組み・実装方法を解説
精度ベンチマーク:SWE-Benchおよび社内評価
以下は、OpenAIが実施したベンチマーク結果の一例です。
ベンチマーク結果
SWE-Bench Verified(ソフトウェア工学ベンチマーク)
モデル | Pass@1 | Pass@4 | Pass@8 |
---|---|---|---|
codex-1 | 67% | 70% | 75% |
o3-high | 11% | — | — |
OpenAI内部SWEタスク
codex-1は、o1-highやo4-mini-highと比較して最大80%以上の精度を記録し、社内での本番開発タスクにおいても十分な性能を発揮しています。
※コンテキスト長は最大192,000トークンに対応しており、大規模コードベースの処理にも対応可能です。
codex-miniとの違い
Codex CLIに搭載されている codex-mini-latest
は、主にo4-miniをベースにした小型版モデルです。軽量で低レイテンシな処理が可能である一方、以下のような違いがあります。
特徴 | codex-1(クラウド) | codex-mini(CLI) |
---|---|---|
モデル規模 | 大型(o3ベース) | 小型(o4-miniベース) |
実行対象 | 複雑なマルチタスク | 軽量なコード編集 |
テスト・PR提案 | 対応(標準機能) | 非対応または限定的 |
コンテキストウィンドウ | 最大192,000トークン | 数千〜1万トークン程度 |
主な用途 | エージェント処理全般 | コード補完・Q&A中心 |
Codexの活用事例
Codexは、OpenAI社内をはじめ、複数の企業や開発チームで実践的に活用されており、現場の開発プロセスに実際のインパクトを与えています。以下に代表的な事例を紹介します。
事例の紹介参考:OpenAI公式
OpenAI社内での活用
OpenAIのエンジニアは、Codexを次のような業務に活用しています。
- 反復的なタスクの自動化:テスト作成、変数名の変更、ログ整備など、集中力を削ぐ単純作業のオフロード
- オンコール対応の補助:インシデント対応時に発生する修正やログ分析の補完
- 朝のタスク整理:ToDoの可視化やコードベースの状態分析から、1日の作業計画を支援
Codexを使うことで、コンテキストスイッチを減らし、本質的な設計や難易度の高い実装作業に集中できる環境が整いつつあります。
企業での導入事例
Cisco(シスコ)
エンジニアリングチームは、プロダクト横断の開発スピード向上を目的にCodexを導入。新機能の初期スキャフォールディングや、複数言語間のコード整備に活用されています。
Superhuman(スーパーヒューマン)
小規模なコード修正やテストカバレッジ向上のためにCodexを使用。プロダクトマネージャーがエンジニアを介さずに一部の修正を行えるようになり、リリースまでのサイクル短縮に貢献しています。
Kodiak(コディアック)
自動運転開発におけるデバッグツールの作成や、コンポーネント単位のリファクタリングにCodexを活用。コードの変更履歴とコンテキストの可視化によって、新規メンバーのキャッチアップ効率も向上しています。
まとめ・今後の展望
Codexは、単なるコード生成ツールではなく、開発者のパートナーとして協働するAIソフトウェアエージェントを目指して進化を続けています。今後は、非同期・協調型のエージェントワークフローを中心に、開発現場の生産性と柔軟性を大きく変える可能性があります。
非同期コラボレーションへの進化
Codexは、長時間にわたるタスクを人間の指示なしに遂行し、適宜フィードバックを受けながら自律的に改善する方向へと進化しています。将来的には、次のような開発体験が一般化すると期待されています。
- エージェントとの並列作業:人間の開発者が主要ロジックを担当し、Codexが補助作業を同時に実行
- 逐次的な指示とガイダンス:途中でレビューコメントを加えることで、タスクの方向性を微調整可能
- 非同期的なチーム協働:チーム内で共有されたタスクを、Codexが他メンバーの代わりに進行
外部ツールとの連携拡大
今後、Codexは以下のような外部ツールとの統合が予定されています。
- GitHubリポジトリとの直接連携(現在も一部対応)
- 課題管理ツール(例:Jira、Linear)からのタスク割当
- CI/CDシステムとの統合(自動PR→テスト→マージ)
- ChatGPT DesktopアプリやCodex CLIからの一貫した操作フロー
開発の中核となるツールとCodexを統合することで、AIエージェントとのやりとりは日常の一部として定着することが期待されます。
Codexは、まだリサーチプレビュー段階にあるツールですが、その進化は着実に“AI開発パートナー”という新たな職能の実現に向かっています。