2025-05-20

【OpenAI】Codexとは？使い方や料金体系を徹底解説【次世代AI】

この記事のポイント

CodexはChatGPT内で動作するAI開発エージェント
codex-1モデルを搭載し、高精度なコーディングが可能
AGENTS.mdによりプロジェクト特化型の指示が可能
Codex CLIはローカルでの軽量作業に最適化

監修者プロフィール

坂本将磨

フォローする

Microsoft MVP・AIパートナー。LinkX Japan株式会社代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。

Codexは、OpenAIが提供するクラウドベースのソフトウェアエンジニアリングエージェントで、複数のコーディングタスクを自律的に実行します。
ChatGPT内から自然に利用でき、バグ修正やテスト生成、PR提案などを代行することで、開発者の生産性を大幅に向上させます。
本記事では、Codexの仕組みや使い方、CLI版との違い、搭載モデル「codex-1」の性能、安全性、導入事例まで詳しく解説します。
AI総合研究所では、企業のChatGPT導入支援を行っています。
お気軽にご相談ください。

Codexとは？

Codexの主な機能とできること

バグ修正・コード生成・テスト作成の自動化

Pull Request（PR）の提案とレビュー支援

AGENTS.mdによるコードベースのナビゲーション

Codex CLIとは？ローカル環境での使い方

Codex CLIの特徴

利用方法とアカウント連携

無料クレジットと料金体系

Codexに搭載されたモデル：codex-1とは？

codex-1のトレーニングの特徴

精度ベンチマーク：SWE-Benchおよび社内評価

Codexとは？

Codexは、OpenAIが開発したソフトウェア開発支援向けのクラウドベースAIエージェントであり、クラウド・CLIの両方で使えるため、開発スタイルに合わせて柔軟に導入できるのが特徴です。ChatGPT内で動作し、コーディングに関するさまざまなタスクを自律的に処理します。

Codexイメージ　参考：OpenAI公式

このエージェントは、OpenAIの最新大規模言語モデル「codex-1」を搭載しており、バグ修正、機能追加、テスト作成、コードレビューの提案など、実際の開発現場で求められる作業を自動で実行できます。

Codexの主な機能とできること

Codexは、日常的なソフトウェア開発タスクを自動で処理する「AIエージェント」として設計されており、以下のような複数の作業を並行して実行できます。

バグ修正・コード生成・テスト作成の自動化

Codexは、自然言語で指示された要件に基づき、ソースコードのバグを特定して修正したり、新機能のコードを生成したりできます。また、テストコードの作成や、既存テストの実行・確認も自動で行います。

Pull Request（PR）の提案とレビュー支援

修正や新機能を加えたコードは、CodexがPRの形でまとめて提示します。PRには変更理由やテスト結果が含まれており、人間のレビュー作業を補完する形で活用できます。

AGENTS.mdによるコードベースのナビゲーション

リポジトリに設置されたAGENTS.mdファイルには、テストの実行コマンド、標準的な開発ルール、重要なフォルダ構成などを記載できます。Codexはこれを読み取り、コードベースの理解と作業精度を向上させます。

コーディングスタイルの自動適応

Codexは、プロジェクトごとのコーディングスタイルや命名規則にも自動で適応します。これは、codex-1モデルが実際のPRや人間の好みに基づいて強化学習されているためで、可読性の高いコードを出力することができます。

ログ・出力による動作の可視化

各タスク実行時には、テスト結果やターミナルログが提示され、Codexの動作が透明な形で示されます。ユーザーはその内容を確認し、変更をローカル環境に適用したり、再修正を依頼したりできます。

Codexの料金

Codexは現在、OpenAIのChatGPTユーザーを対象に段階的に提供が進められており、クラウド版とCLI版でそれぞれ異なる価格体系や提供方法が設定されています。

ChatGPT上でのCodex提供状況

2025年5月時点で、Codexは以下のプランで利用可能です。

プラン	提供状況
ChatGPT Pro	利用可能（リサーチプレビュー）
ChatGPT Team	利用可能
ChatGPT Enterprise	利用可能
ChatGPT Plus	近日中に提供開始予定
ChatGPT Edu	近日中に提供予定

※現在は追加料金なしで利用可能ですが、正式リリース後は段階的にレート制限やオプション課金が導入される予定です。

Codexの使い方

Codexの仕組みと使い方

Codexは、ChatGPT上から直接アクセスできるAIエージェントで、1つ1つのタスクをクラウド上の独立した環境で実行します。ここではその仕組みと使い方を詳しく解説します。

ChatGPTからの起動方法

Codexは、ChatGPTのサイドバーから利用可能です。タスクを始めるには、ChatGPTのUI上で以下のような操作を行います。

プロンプトを入力（例：「このバグを修正して」）
コードボタンをクリックしてタスクを割り当て
必要に応じて質問するボタンでリポジトリ内のコードに関する質問も可能

実行環境：クラウドサンドボックス

Codexがタスクを実行するのは、ユーザーのリポジトリが事前にロードされたクラウド上の隔離環境（サンドボックス）です。この環境では、以下のことが可能です。

ファイルの読み取りと編集
テストスクリプトやビルドコマンドの実行
リンターや型チェッカーの実行

これらはプロジェクトに応じて1分〜30分ほどで処理され、結果がリアルタイムで表示されます。

AGENTS.mdによる高度な制御

リポジトリにAGENTS.mdファイルを追加することで、Codexに以下のような設定を指示できます。

テストを実行するための具体的なコマンド
使用すべきビルドシステムや依存関係
プロジェクトの標準スタイルや命名規則

これは従来のREADME.mdに似た仕組みですが、Codexの動作指針として特化しており、エージェントの精度と信頼性を高める鍵となります。

実行結果の確認と次のアクション

タスクが完了すると、Codexは以下の情報を提示します。

修正内容の差分（diff）
ターミナルログとテスト結果
PRとして提案された場合はその要点

ユーザーは、内容を確認してPRをGitHubへ送信したり、ローカルに取り込んだり、さらなる修正を依頼することが可能です。

Codex CLIとは？ローカル環境での使い方

Codex CLIとは、ターミナル上で動作する軽量なコーディングエージェントツールです。CodexをChatGPTの外でも利用できるようにしたもので、手元の開発ワークフローに自然に組み込めます。

Codex CLIの特徴

Codex CLIは、OpenAIの小型モデル「codex-mini-latest（o4-miniベース）」を搭載し、以下の用途に最適化されています。

ローカルのコードファイルを対象にしたQ&Aやコード生成
シンプルなコード修正・補完の高速化
スニペット単位のやり取りに最適な低レイテンシ設計

クラウド版Codexが複雑なタスクや大規模なリポジトリ向けであるのに対し、Codex CLIはローカルでの軽量作業に特化しています。

利用方法とアカウント連携

Codex CLIの導入は以下のように簡単に行えます。

CLIツールをインストール（npm または pip 経由）
初回起動時に、ChatGPTアカウントでサインイン
使用する組織を選択すると、自動でAPIキーが設定される

これにより、手動でAPIトークンを生成・管理する手間が不要になりました。

無料クレジットと料金体系

Codex CLIユーザーは、ChatGPTのPlus／Proアカウントに応じて、以下の無料APIクレジットを利用可能です（初回のみ）：

Plusユーザー：5ドル分の無料クレジット
Proユーザー：50ドル分の無料クレジット

また、codex-mini-latestのAPI料金は次のとおりです。

トークン種別	単価（100万トークンあたり）	備考
入力トークン	$1.50	キャッシュ適用前
出力トークン	$6.00	最大75%のキャッシュ割引あり

※モデルはAPIのResponsesエンドポイント経由で使用され、今後も定期的なアップデートが予定されています。

Codexに搭載されたモデル：codex-1とは？

Codexに搭載されている「codex-1」は、OpenAIの第三世代大規模言語モデル「o3」をベースに、ソフトウェアエンジニアリングに特化して最適化されたモデルです。Codexの高精度なコード生成・レビュー・修正提案といった機能は、このモデルの能力によって支えられています。

codex-1のトレーニングの特徴

codex-1は以下のような方法で開発されました。

強化学習（RLHF）によるチューニング：人間の好みに合ったコードスタイルやPR提案形式を学習
現実の開発タスクに基づく微調整：社内外の実際のPull Request、テスト、バグ修正を学習対象に含む
高精度な反復試行処理：タスク完了までコードを生成・実行・修正するサイクルを複数回自動で行う能力を持つ

これにより、codex-1は一般的な言語モデルと異なり、「テストに合格するまで修正を繰り返す」ようなエンジニア的な動作ロジックを内在しています。

精度ベンチマーク：SWE-Benchおよび社内評価

以下は、OpenAIが実施したベンチマーク結果の一例です。

ベンチマーク結果

SWE-Bench Verified（ソフトウェア工学ベンチマーク）

モデル	Pass@1	Pass@4	Pass@8
codex-1	67%	70%	75%
o3-high	11%	—	—

OpenAI内部SWEタスク

codex-1は、o1-highやo4-mini-highと比較して最大80%以上の精度を記録し、社内での本番開発タスクにおいても十分な性能を発揮しています。

※コンテキスト長は最大192,000トークンに対応しており、大規模コードベースの処理にも対応可能です。

codex-miniとの違い

Codex CLIに搭載されている codex-mini-latest は、主にo4-miniをベースにした小型版モデルです。軽量で低レイテンシな処理が可能である一方、以下のような違いがあります。

特徴	codex-1（クラウド）	codex-mini（CLI）
モデル規模	大型（o3ベース）	小型（o4-miniベース）
実行対象	複雑なマルチタスク	軽量なコード編集
テスト・PR提案	対応（標準機能）	非対応または限定的
コンテキストウィンドウ	最大192,000トークン	数千〜1万トークン程度
主な用途	エージェント処理全般	コード補完・Q&A中心