この記事のポイント
GPT-3.5 TurboのAPI専用化と基本仕様(コンテキスト16Kトークン、入力0.25ドル/1Mトークン)
GPT-3.5 Turbo・GPT-4o mini・GPT-4.1・GPT-4o・GPT-5の5モデル料金・性能比較
GPT-4o miniへの移行ガイドと既存ファインチューニングモデルの対応方法

Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。
OpenAIが2023年3月に公開したGPT-3.5 Turboは、高速な応答性能とコスト効率で多くの開発者に利用されてきたChatGPTの初期モデルです。
2026年現在、GPT-3.5 TurboはChatGPTのWebサイトやアプリからは選択できなくなり、OpenAIのAPI経由でのみ提供されています。GPT-4o miniやGPT-5 miniといった後継モデルの登場により、GPT-3.5 Turboからの移行を検討する開発者が増えています。
本記事では、GPT-3.5 Turboの基本仕様からAPI料金体系、最新5モデルとの性能・コスト比較、そして推奨される移行先と手順までを体系的に解説します。
目次
GPT-3.5 Turboとは(2026年最新)

GPT-3.5 Turboは、OpenAIが2023年3月8日に公開した大規模言語モデルです。自然言語処理の分野で高い性能を示し、ChatGPTの初期モデルとして世界中の開発者や企業に利用されてきました。GPT-3の進化版として位置づけられ、応答速度の大幅な向上とコスト効率の改善が最大の特長です。
2025年8月のGPT-5リリースに伴い、GPT-3.5 TurboはChatGPTのWebサイトやアプリ上では選択できなくなりました。2026年3月現在、GPT-3.5 TurboはOpenAIのAPI経由でのみ利用可能なモデルです。ChatGPT無料版のデフォルトモデルはGPT-5に移行しており、無料プランのChatGPT GoでもGPT-5が標準搭載されています。
以下の表で、GPT-3.5 Turboの基本仕様を整理しました。現在のステータスや料金を確認する際の参考にしてください。
| 項目 | 内容 |
|---|---|
| 開発元 | OpenAI |
| 公開日 | 2023年3月8日 |
| モデルID | gpt-3.5-turbo |
| コンテキストウィンドウ | 16,385トークン |
| 対応モダリティ | テキストのみ |
| 利用形態 | API経由のみ(Web/アプリ非対応) |
| API料金(入力) | 0.25ドル/1Mトークン |
| API料金(出力) | 0.75ドル/1Mトークン |
| ファインチューニング | 対応(追加料金あり) |
この表が示すとおり、GPT-3.5 Turboは2026年現在も最もコストの低いGPTモデルの1つです。ただし、同価格帯のGPT-4o miniが推論精度・コンテキスト長・マルチモーダル対応のすべてでGPT-3.5 Turboを上回っています。さらに一部のバリアント(gpt-3.5-turbo-1106など)は2026年後半に非推奨化が予定されており、既存システムでGPT-3.5 Turboを利用している開発者にとっては、移行先の検討が急務といえるでしょう。
GPT-3.5 Turboの特長と仕様
GPT-3.5 Turboが多くの開発者に支持されてきた理由は、処理速度、コスト効率、ファインチューニング対応の3点に集約されます。GPT-4と比較して推論精度は劣るものの、単純なテキスト生成やFAQ応答といったタスクでは十分な性能を発揮し、APIコストを大幅に抑えられる点が最大の利点でした。
GPT-3.5 Turboの主な仕様として、最大16,385トークンのコンテキストウィンドウ、テキストのみのシングルモーダル対応、JSON Modeによる構造化出力のサポートがあります。2024年1月のアップデートにより、関数呼び出し(Function Calling)の精度も向上しました。プログラミングでのChatGPT活用においても、GPT-3.5 TurboのAPIは低コストで気軽に試せるモデルとして広く利用されてきた実績があります。
GPT-3.5 Turboの処理速度とファインチューニング
GPT-3.5 Turboの最も顕著な特徴は、高速な処理速度です。OpenAI公式のモデルドキュメントによると、GPT-3.5 TurboはGPT-3と比較して応答速度が数倍から10倍程度高速化されており、ほぼリアルタイムでのレスポンスを実現しています。この高速性は、チャットボットやリアルタイム翻訳など、低レイテンシが求められるアプリケーションで特に有効です。実際にInstacartやShopifyなどの企業がGPT-3.5 Turboを商品推薦やカスタマーサポートのチャットボットに採用してきました。
もう1つの重要な特長が、ファインチューニングへの対応です。ファインチューニングとは、特定のタスクや領域に合わせてモデルを追加学習させることで、より専門的な性能を引き出す技術です。GPT-3.5 Turboでは、自社の業務データや専門用語を学習させることで、カスタマーサポート、法律文書の要約、医療用語の解釈など、特定ドメインに最適化したモデルを構築できます。ファインチューニング済みモデルの料金は、トレーニングが1Mトークンあたり8.00ドル、推論の入力が0.50ドル/1Mトークン、出力が1.50ドル/1Mトークンです。
ただし、2026年現在ではGPT-4o miniのファインチューニングも一般提供されており、GPT-3.5 Turboと同等のコストでより高い推論精度を実現できるようになっています。新規のファインチューニングプロジェクトを開始する場合は、GPT-4o miniの利用を検討することをおすすめします。
GPTモデルの進化と料金比較
GPTシリーズはTransformerアーキテクチャをベースとしており、世代を重ねるごとに大きく進化しています。GPT-3.5 Turboの位置づけを正確に理解するためには、最新モデルとの比較が不可欠です。以下の表で、2026年3月時点で利用可能な主要5モデルの性能と料金を比較しました。
| 項目 | GPT-3.5 Turbo | GPT-4o mini | GPT-4.1 | GPT-4o | GPT-5 |
|---|---|---|---|---|---|
| リリース時期 | 2023年3月 | 2024年7月 | 2025年4月 | 2024年5月 | 2025年8月 |
| コンテキスト | 16Kトークン | 128Kトークン | 1Mトークン | 128Kトークン | 400Kトークン |
| マルチモーダル | テキストのみ | テキスト・画像 | テキスト・画像 | テキスト・画像・音声 | テキスト・画像 |
| 推論能力 | 基本的 | 中程度 | 高度 | 高度 | 最高水準 |
| 処理速度 | 高速 | 高速 | 高速 | 中速 | 高速(自動最適化) |
| 入力料金(/1M) | 0.25ドル | 0.15ドル | 2.00ドル | 2.50ドル | 1.25ドル |
| 出力料金(/1M) | 0.75ドル | 0.60ドル | 8.00ドル | 10.00ドル | 10.00ドル |
| ファインチューニング | 対応 | 対応 | 対応 | 非対応 | 非対応 |
この比較で特に重要なのは、GPT-4o miniの存在です。GPT-3.5 Turboよりもさらに安価な入力0.15ドル/出力0.60ドルでありながら、128Kトークンのコンテキストウィンドウと画像認識に対応しています。つまり、コスト面でもGPT-3.5 Turboを選ぶ理由はほぼなくなっているのが現状です。
GPT-5は2025年8月に発表された最新のフラッグシップモデルで、タスクの複雑さに応じてAIが自動で思考の深さを切り替える「統一システム」として設計されています。ハルシネーション(事実誤認)が約45〜80%削減され、コーディングや医療分野で飛躍的な性能向上を達成しました。
GPTモデルの用途別選定ガイド
GPTモデルは用途と予算に応じて最適な選択肢が異なります。以下に、代表的なユースケースごとの推奨モデルをまとめました。
-
コスト最優先の大量テキスト処理
GPT-4o miniが最適です。入力0.15ドル/1Mトークンは全GPTモデルで最安であり、FAQ応答、テキスト分類、要約など基本的なタスクでGPT-3.5 Turboを大きく上回る精度を発揮します。
-
高精度な推論と長文処理
GPT-4.1が有力な選択肢です。1Mトークンのコンテキストウィンドウにより、大規模なコードベースの分析や長文ドキュメントの処理に対応します。GPT-4oと比較して入力料金が20%安価です。
-
最高の信頼性とマルチタスク
GPT-5は、深い推論が求められるタスクや、ハルシネーションを最小限に抑えたい業務に最適です。自動ルーティングにより、単純な質問には高速に、複雑な推論には時間をかけて回答します。
-
既存のGPT-3.5 Turbo環境を維持したい場合
レスポンス形式やファインチューニング済みモデルの互換性を重視する場合は、当面GPT-3.5 Turboの継続利用も選択肢です。ただし、一部のバリアント(gpt-3.5-turbo-1106など)は2026年後半に非推奨化が予定されているため、早期の移行計画策定をおすすめします。
他社の生成AIモデルとして、Claude、Gemini、Copilotなども選択肢に入れて比較検討することで、自社の要件に最適なモデルを選定できます。
GPT-3.5 TurboのAPI料金体系
GPT-3.5 Turboは従量課金制を採用しています。APIの利用料金は、送信したテキスト(入力トークン)と生成されたテキスト(出力トークン)の量に基づいて計算されます。以下の表で、GPT-3.5 Turboの料金体系を整理しました。
| 料金項目 | 単価(1Mトークンあたり) |
|---|---|
| 入力トークン | 0.25ドル |
| 出力トークン | 0.75ドル |
| ファインチューニング(トレーニング) | 8.00ドル |
| ファインチューニング後の入力 | 0.50ドル |
| ファインチューニング後の出力 | 1.50ドル |
| キャッシュされた入力 | 0.125ドル |
実務で重要なのは、ファインチューニング後の推論料金が通常の2倍になる点です。たとえば、月間1,000万トークンの入出力を処理する場合、通常モデルでは約10ドル(入力2.5ドル+出力7.5ドル)で済みますが、ファインチューニング済みモデルでは約20ドル(入力5ドル+出力15ドル)になります。
料金計算の基準となるトークンとは、GPT-3.5 Turboの利用コストを計算する単位です。英語の場合は1単語が約1〜1.5トークン、日本語の場合は1文字が約1〜3トークンに相当します。たとえば、日本語の1,000文字のテキストを入力すると約1,500〜3,000トークンを消費し、料金は約0.0004〜0.0008ドル(0.06〜0.12円)です。OpenAIのトークナイザーツールを使えば、テキストのトークン数を事前に確認できます。
APIの利用制限やレート制限も把握しておく必要があります。GPT-3.5 Turboの無料枠(Tier 0)では1分あたり3リクエスト、1日あたり200リクエストの制限があります。有料枠にアップグレードすることで制限が大幅に緩和されます。ChatGPT APIの料金について、モデル別の詳細な比較や費用を抑えるコツは関連記事で解説しています。
バックオフィス業務をAIで自動化 AI Agent Hub
Microsoft Teams上でAIエージェントが業務を代行
経費精算・請求書処理をAIが自動実行。Microsoft Teams上でAIエージェントが業務を代行し、金融機関レベルのセキュリティで安心導入。
GPT-3.5 Turboからの移行ガイド
GPT-3.5 Turboは2026年3月時点でも利用可能ですが、OpenAIは公式に後継モデルへの移行を推奨しています。一部のバリアント(gpt-3.5-turbo-1106、gpt-3.5-turbo-0125など)は2026年後半に非推奨化が予定されており、既存システムでGPT-3.5 Turboを利用している場合は、計画的な移行が必要です。
OpenAIが推奨する主な移行先は、GPT-4o miniです。GPT-4o miniは入力0.15ドル/出力0.60ドルとGPT-3.5 Turboよりもさらに安価でありながら、推論精度、コンテキスト長、マルチモーダル対応のすべてでGPT-3.5 Turboを上回っています。API呼び出しの形式もGPT-3.5 Turboとほぼ同一であるため、モデルIDを変更するだけで基本的な移行が完了します。
ChatGPT Plusを含む各種プランでもGPT-5が標準モデルとなっており、API利用者もこの流れに沿って新しいモデルへの移行を進めることで、コスト削減と性能向上の両立が可能です。
GPT-3.5 Turboからの移行時の注意点と推奨モデル
移行を実施する際は、以下の3つのポイントに注意が必要です。
-
ファインチューニング済みモデルの互換性
GPT-3.5 Turboでファインチューニングしたモデルは、GPT-4o miniにそのまま移行できません。GPT-4o miniで新たにファインチューニングを実施する必要があります。ただし、学習データセットは再利用可能なため、データの準備コストは最小限で済みます。OpenAIのファインチューニングガイドに移行手順の詳細が記載されています。
-
レスポンス形式の差異
GPT-4o miniはGPT-3.5 Turboとほぼ同一のレスポンス形式を返しますが、推論精度の向上により出力内容が変わる場合があります。特に、テンプレートベースの出力を前提としたシステムでは、プロンプトの調整が必要になることがあります。移行前にテスト環境での検証を推奨します。
-
トークン消費量の変化
GPT-4o miniはGPT-3.5 Turboと異なるトークナイザーを使用しているため、同じテキストでもトークン消費量が変動する場合があります。移行後の料金シミュレーションを事前に実施し、想定外のコスト増加がないことを確認してください。OpenAIのトークナイザーツールで両モデルのトークン数を比較できます。
まとめ
本記事では、GPT-3.5 Turboの基本仕様、最新GPTモデルとの比較、API料金体系、そして移行ガイドまでを体系的に解説しました。
GPT-3.5 Turboは、2023年の公開以来、高速な処理速度とコスト効率で多くの開発者に利用されてきました。しかし、2026年現在ではGPT-4o miniがGPT-3.5 Turboよりも安価かつ高性能なモデルとして提供されており、新規開発でGPT-3.5 Turboを選択する理由は限定的になっています。一部バリアントの非推奨化も予定されているため、既存システムの計画的な移行が求められます。
GPT-3.5 Turboからの移行を検討している方は、以下の手順で進めることをおすすめします。
- 現在のAPIコールでGPT-3.5 Turboを使用している箇所を洗い出す
- テスト環境でGPT-4o miniに切り替え、出力品質とトークン消費量を検証する
- ファインチューニング済みモデルがある場合は、GPT-4o miniでの再学習を計画する
GPTモデルの選定に迷った場合は、ChatGPT APIの料金比較記事やGPT-5の解説記事もあわせてご確認ください。












