Azure OpenAI Serviceの料金体系の概要

Azure OpenAI Serviceの料金は、ユーザーが使用する料金プラン・デプロイメント・モデルによって異なります。

まず最初に、主な料金決定要素についてご紹介します。

料金プラン

Azure OpenAI Serviceは、主に以下の3つの料金プランがあります。

Standard (従量課金制 / オンデマンド)
使用した分だけ（主に入力トークンと出力トークンに応じて）料金が発生する「Pay-as-you-go」方式です。柔軟な利用が可能です。
Provisioned (PTU / プロビジョニング済みスループット)
特定のモデルに対して一定のスループット（処理能力）をPTU（Provisioned Throughput Unit）単位で事前に割り当て、確保するプランです。
予測可能なコストとパフォーマンスが必要な場合に適しており、月額または年額の予約により割引が適用されます。
バッチAPI
リアルタイム性が不要な大量の非同期リクエストを処理するためのオプションです。
通常、Global Standard価格の50%割引で提供され、24時間以内に結果が返されます。（言語モデルで利用可能）

デプロイメントの種類

StandardとProvisionedプランでは、以下のデプロイメントの種類を選択できます。

これにより、価格設定、パフォーマンス、データ処理の境界に対する柔軟性と制御が向上します。

Global (グローバルデプロイ)
特定のリージョンに縛られず、Azureのグローバルネットワークを利用します。グローバルSKUとして提供されます。
US/EU – Data Zones (データゾーンデプロイ)
特定のデータゾーン（現在はヨーロッパまたは米国）に限定して利用します。データ処理の境界が重要な場合に選択されます。
Regional (リージョンデプロイ)
特定のAzureリージョン（例: 東日本、最大27リージョン）に限定してデプロイします。レイテンシの最適化や地域固有の要件に対応します。

モデル

利用するAIモデルの種類（例: o1-mini, GPT-4o）によって料金が大きく異なり、高性能なモデルほど高価になる傾向があります。

テキスト生成、推論特化、画像生成、音声処理、埋め込み、エージェント機能など、タスクに応じたモデルが存在します。

トークン

多くのモデルの料金は、処理されたトークン数に基づいて計算されます。トークンはテキストデータの基本単位で、単語や文字の一部に対応します。

料金表では「1,000トークンあたり」または「1M（100万）トークンあたり」の単価で示されることが一般的です。
入力トークンと出力トークンで単価が異なる場合が多いです。

standard（従量課金制）の具体的な料金について

ここではstandard（従量課金制）の具体的な料金について、モデルごとにその特徴と共にご紹介していきます。

本記事では主に東日本リージョンでAzure OpenAI Serviceを利用した場合の試算を示します。

価格表の見方:

価格は特に記載がない限り「100万トークンあたり」の日本円(¥)です。
「キャッシュされた入力」は、特定の条件下で適用される割引価格です。
「Batch API 価格」は、Batch API利用時の割引後価格（通常50%割引）です。
「該当なし」または「N/A」は、そのデプロイメント種類やオプションが利用できないか、料金が発生しないことを示します。

GPT-4.5

現時点でプレビュー提供されている最新鋭の汎用モデルです。非常に広範な知識を持ち、複雑な指示やユーザーの意図を深く理解する能力に長けています。

創造性が求められるタスクや、自律的に計画を立てて実行するようなエージェント機能の実装に適しています。

主な特徴:
28Kコンテキストウィンドウ、2023年10月ナレッジカットオフ。

モデル	デプロイメント	価格 (100万トークン)	Batch API 価格 (100万トークン)
GPT-4.5-Preview-2025-02-27	Global	入力: ¥11,324.25 キャッシュ入力: ¥5,662.13 出力: ¥22,648.50	N/A

o1

複雑な問題解決や論理的な思考（推論）に特化して設計された新しいモデルシリーズです。数学、科学、コーディングといった分野で特に高い性能を発揮します。
長文の読解や生成が必要なタスクにも対応できる、非常に大きなコンテキストウィンドウを持つのも特徴です。**

コンテキストウィンドウ:200K
ナレッジカットオフ:2023年10月

モデル	デプロイメント	価格 (100万トークン)	Batch API 価格 (100万トークン)
o1 2024-12-17	Global	入力: ¥2,264.85 キャッシュ入力: ¥1,132.43 出力: ¥9,059.40	N/A
	US/EU – Data Zones	該当なし	N/A
	Regional	該当なし	N/A
o1 preview 2024-09-12	Global / Data Zones / Regional	該当なし	N/A

o3 Mini / o1-mini

o1シリーズのコンセプトを引き継ぎつつ、速度とコスト効率を重視した軽量版の推論モデルです。「o3-mini」は「o1-mini」の改良版で、より大きなコンテキストを扱えるようになっています。
比較的安価ながら、コーディングや数学などのタスクで高い効率を発揮します。**

o3-mini
- コンテキストウィンドウ: 200K (入力) / 100K (出力)
- ナレッジカットオフ: 2023年10月
o1-mini
- コンテキストウィンドウ: 128K (入力)
- ナレッジカットオフ: 2023年10月

モデル	デプロイメント	価格 (100万トークン)	Batch API 価格 (100万トークン)
o3 mini 2025-01-31	Global	入力: ¥166.09 キャッシュ入力: ¥83.04 出力: ¥664.36	入力: ¥83.04 出力: ¥332.18
	US/EU – Data Zones	該当なし	該当なし
	Regional	該当なし	N/A
o1-mini 2024-09-12	Global	入力: ¥166.09 キャッシュ入力: ¥83.04 出力: ¥664.36	N/A
	US/EU – Data Zones	該当なし	N/A
	Regional	該当なし	N/A

4o

最先端のマルチモーダルモデルです。テキストだけでなく画像入力にも対応し、以前のGPT-4 Turboモデルよりも高速かつ安価に利用できます。幅広いタスクに対応できる汎用性と高い性能を兼ね備えています。

コンテキストウィンドウ: 128K
ナレッジカットオフ: 2023年10月

モデル	デプロイメント	価格 (100万トークン)	Batch API 価格 (100万トークン)
GPT-4o-2024-1120	Global	入力: ¥377.48 キャッシュ入力: ¥188.74 出力: ¥1,509.90	入力: ¥188.74 出力: ¥754.95
	US/EU – Data Zones	入力: ¥415.22 キャッシュ入力: ¥207.61 出力: ¥1,660.89	入力: ¥207.61 出力: ¥830.45
	Regional (東日本など)	入力: ¥456.74 キャッシュ入力: ¥228.45 出力: ¥1,826.98	N/A
GPT-4o-2024-08-06	Global	入力: ¥377.48 キャッシュ入力: ¥188.74 出力: ¥1,509.90	入力: ¥188.74 出力: ¥754.95
	US/EU – Data Zones	該当なし	該当なし
	Regional	該当なし	N/A
GPT-4o-2024-0513 (旧ver)	Global	入力: ¥754.95 出力: ¥2,264.85	該当なし
	US/EU – Data Zones	該当なし	N/A
	Regional	該当なし	N/A

GPT-4o mini

GPT-4oの能力を維持しつつ、大幅にコスト効率を高めた小型モデルです。テキストと画像の入力に対応しており、速度とコストが重要視される多くのアプリケーションに適しています。**

コンテキストウィンドウ: 128K
ナレッジカットオフ: 2023年10月

モデル	デプロイメント	価格 (100万トークン)	Batch API 価格 (100万トークン)
GPT-4o-mini-0718	Global	入力: ¥22.65 キャッシュ入力: ¥11.32 出力: ¥90.59	入力: ¥11.32 出力: ¥45.30
	US/EU – Data Zones	該当なし	該当なし
	Regional	該当なし	N/A

Base Models (旧世代)

【どんなモデル？】以前の世代の基本的なテキスト生成モデルです。
特定の用途や互換性のために利用される場合がありますが、現在ではより高性能でコスト効率の良い新しいモデルが推奨されます。

モデル	価格 (1,000トークンあたり)
Babbage-002	¥0.0604
Davinci-002	¥0.3020

モデルの埋め込み (Embedding)

テキストデータを数値ベクトルに変換し、意味的な類似性検索や分類、クラスタリングなどのタスクに利用するためのモデルです。

モデル	価格 (1,000トークンあたり)
Ada (旧世代)	¥0.0151
text-embedding-3-large	該当なし (東日本では)
text-embedding-3-small	¥0.0030

画像モデル(DALL E)

テキストの説明から画像を生成するモデルです。クリエイティブな用途やコンテンツ作成に活用できます。

モデル	品質	解像度	価格 (画像 100 件あたり)
Dall-E-3	Standard	1024 * 1024	¥603.960
	Standard	1024 * 1792, 1792 * 1024	¥1,207.920
	HD	1024 * 1024	¥1,207.920
	HD	1024 * 1792, 1792 * 1024	¥1,811.880
Dall-E-2	Standard	1024 * 1024	¥301.980

音声モデル (Whisper, TTS)

Whisperは音声をテキストに変換（音声認識）、TTSはテキストを自然な音声に合成（音声合成）するモデルです。**

モデル	課金単位	価格 (JPY)
Whisper	時間あたり	¥54.36
TTS (テキスト読み上げ)	100万文字あたり	該当なし
TTS HD	100万文字あたり	該当なし

Fine-tuning Models（微調整モデル）

ベースとなるモデルを、ユーザー固有のデータセットで追加学習させ、特定のタスクやドメインに合わせて性能をカスタマイズする機能です。

トレーニング（学習）、ホスティング（デプロイ維持）、推論（利用時）のそれぞれにコストが発生します。**

モデル	デプロイメント	価格
GPT-4o-2024-08-06	Regional	入力: ¥415.22/1Mトークンキャッシュ入力: ¥207.61/1Mトークン出力: ¥1,660.89/1Mトークントレーニング: ¥4,152.3/1Mトークンホスティング: ¥256.7/時
	Global	入力: ¥377.48/1Mトークンキャッシュ入力: ¥188.74/1Mトークン出力: ¥1,509.90/1Mトークントレーニング: Regionalを使用ホスティング: ¥256.7/時
GPT-4o-mini	Regional	該当なし
	Global	該当なし (トレーニングはRegionalを使用)
GPT-4-0613 (8K)	Regional	該当なし
GPT-3.5-Turbo (16K)	Regional	入力: ¥75.5/1Mトークン出力: ¥226.5/1Mトークントレーニング: ¥1,207.92/1Mトークンホスティング: ¥256.7/時
GPT-3.5-Turbo (4K)	Regional	入力: ¥75.5/1Mトークン出力: ¥226.5/1Mトークントレーニング: ¥1,208.0/1Mトークンホスティング: ¥256.7/時
Babbage-002	(指定なし)	入力: ¥60.40/1Mトークン出力: ¥60.40/1Mトークントレーニング: ¥60.4/1Mトークンホスティング: ¥256.7/時
Davinci-002	(指定なし)	入力: ¥301.98/1Mトークン出力: ¥301.98/1Mトークントレーニング: ¥906.0/1Mトークンホスティング: ¥256.7/時

新しいAPIファミリーと機能の料金

Azure OpenAI Serviceでは、特定のタスクに特化した新しいAPIや、AIエージェント構築を支援する組み込みツールも提供されており、それぞれに料金設定があります。

Realtime API

非常に低い遅延（レイテンシ）でリアルタイムな対話を実現するために最適化されたAPIです。

多言語の音声合成機能もサポートしており、応答性の高いチャットボットや会話型AIアプリケーションの構築に適しています。

モデル	デプロイメント	価格 (100万トークン) - テキスト	価格 (100万トークン) - オーディオ
GPT-4o-Realtime-Preview-2024-12-17	Global	入力: ¥754.95 キャッシュ: ¥377.48 出力: ¥3,019.80	入力: ¥6,039.60 キャッシュ: ¥377.48 出力: ¥12,079.20
	US/EU, Regional	該当なし	該当なし
GPT-4o-Mini-Realtime-Preview-2024-12-17	Global	入力: ¥90.59 キャッシュ: ¥45.30 出力: ¥362.38	入力: ¥1,509.90 キャッシュ: ¥45.30 出力: ¥3,019.80
	US/EU, Regional	該当なし	該当なし
GPT-4o-Realtime-Preview-2024-10-01 (旧バージョン例)	Global	入力: ¥754.95 キャッシュ: ¥377.48 出力: ¥3,019.80	入力: ¥15,099.00 キャッシュ: ¥3,019.80 出力: ¥30,198.00
	US/EU, Regional	該当なし	該当なし

Chat Completions API (Audio)

音声コンテンツの処理（認識）と生成（合成）を行うためのAPIです。

リアルタイム性はRealtime APIほど高くありませんが、非同期での音声対話や、より複雑な音声処理、感情分析などのタスクに適しています。

モデル	デプロイメント	価格 (100万トークン) - テキスト	価格 (100万トークン) - オーディオ
GPT-4o-Audio-Preview-2024-12-17	Global	入力: ¥377.48 出力: ¥1,509.90	入力: ¥6,039.60 出力: ¥12,079.20
	US/EU, Regional	該当なし	該当なし
GPT-4o-Mini-Audio-Preview-2024-12-17	Global	入力: ¥22.65 出力: ¥90.59	入力: ¥1,509.90 出力: ¥3,019.80
	US/EU, Regional	該当なし	該当なし

Computer-Using Agent (CUA)

AIがコンピューターのグラフィカルユーザーインターフェース（GUI）を操作できるようにする特殊なモデル/機能です。

自然言語の指示に基づいて、アプリケーションのナビゲーションや複数ステップのタスク自動化を可能にします。Responses APIのツールとして利用されます。

モデル	デプロイメント	価格 (100万トークン)
computer-use-preview	Global	入力: ¥452.97 出力: ¥1,811.88

Built-in tools (Assistants API / Responses API)

開発者がAIエージェント（自律的にタスクを実行するAI）を容易に構築できるようにするための、事前に用意されたツール群です。

ファイル検索、コード実行、外部機能呼び出しなどをAIに実行させることが可能になります。**

ツール	課金単位	価格 (JPY)	備考
Computer Use (Responses API)	100万トークン (入力/出力)	入力: ¥452.97 出力: ¥1,811.88	CUAモデル利用時
File Search Tool Call (Responses API)	1,000 ツールコールあたり	¥377.475
File Search Storage	1GB / 日あたりのベクトルストレージ	¥15.099	最初の1GBは無料
Code Interpreter	セッションあたり	¥4.5297	各セッションはデフォルト1時間アクティブ。同時セッション数で課金増加。

Azure OpenAI Servicesの利用

さて、ここからは実際の作成手順についてご紹介します。

※ 前提準備

以下を用意する必要があります。

Azureアカウント、サブスクリプション、リソースグループ
AIモデルをデプロイするためのアクセス許可

アカウント作成についてはこちらもご覧ください。

【関連記事】

➡️Azure Portalとは？操作方法やメリットをわかりやすく解説！

ステップ1: Azureポータルにサインイン

Azureポータルにアクセスし、Azureアカウントでサインインします。

Azureポータル画面

ステップ2: Azure OpenAI Serviceの作成

Azureポータル画面の「リソースの作成」で"Azure OpenAI"で検索し、「Azure OpenAI」をクリックします。

AzureOpenAI選択画面

「Azure OpenAIの作成」画面、「基本」タブで適切な設定をします。

※Azure Open AI Serviceの価格レベルによって料金が異なります。ここではstandardを選択します。

「次へ」をクリックします。

基本タブ画面

「ネットワーク」タブで適切な設定をします。

「次へ」をクリックします。

ネットワークタブ画面

「Tags」タブで適切な設定をします。

「次へ」をクリックします。

Tagsタブ画面

「レビューおよび送信」タブで設定に問題がないことを確認します。

「作成」をクリックします。

レビューおよび送信タブ画面

デプロイ完了後、「リソースに移動」をクリックします。

デプロイ完了画面

ステップ3: モデルのデプロイ

AIモデルをデプロイして利用可能にするプロセスです。ここでは、Azure OpenAI サービスで提供されるさまざまな AI モデルを選択し、選択したモデルを独自の環境にデプロイすることで利用準備を整えることができます。

作成したAzure OpenAI Serviceから、「モデルデプロイ」をクリックします。

モデルデプロイ選択画面

「展開の管理」をクリックすると、Azure OpenAI Studioを利用することができます。

展開の管理選択画面

Azure OpenAI Studioは、Azure OpenAI Serviceを使ってモデルのテストや設定を行うためのブラウザベースのインターフェースです。開発者やビジネスユーザーが、Azure上で提供されているAIモデル（GPTなど）を使いやすくするために設計されています。

Azure OpenAI Studioの画面より「モデルのデプロイ」をクリックします。

AzureOpenAIStudio画面

いくつかの選択肢が表示されます。ここでは「基本モデルをデプロイする」を選択しました。クリックすると、Azureで利用できる幅広いモデルの中から、微調整されていない標準的なモデルを選んでデプロイすることが可能です。

基本モデルをデプロイする画面

AIのモデルを選択することができます。選択したモデルによって料金も異なるため、コスト面も考慮しながら選択する必要があります。

基本モデル画面

Azure OpenAI Studio には、利用可能なモデルが一覧表示されているモデルカタログがあります。カタログでは、用途や性能、料金に応じたさまざまなモデルの詳細情報を確認することができます。

「モデルカタログへ移動します」をクリックします。

モデルカタログ移動画面

モデルカタログ画面

Azureの料金計算ツール

Azure OpenAI Serviceを利用する際の料金を計算し見積もるためには、Microsoftが提供する料金計算ツールを使用することが有効です。具体的には、API呼び出しの頻度、使用するモデルの種類、データの量などのパラメータをユーザーが入力すると、それに基づいて料金が計算されるシステムです。

Azure OpenAI Serviceの料金計算ツール

【関連記事】
➡️ Azureの料金計算ツールの利用方法！基本機能や円表示の手順を解説

まとめ

本記事ではAzure OpenAI Serviceの料金体系の概要・言語モデル・料金プランについて説明しました。また料金を簡単に計算するための計算ツールについても説明しました。

Azure OpenAI Serviceは、Microsoft Azure上で提供されるAzure AIサービスの1つで、OpenAIの高度なAIモデル（GPT-4、GPT-3.5、DALL-Eなど）を利用できるサービスです。このサービスにより、テキスト生成、音声認識、画像生成など、さまざまな高度なAI機能をAzure上で簡単に活用できます。

ぜひAzure OpenAI Serviceを導入する際には、上記料金体系を参考にし、ニーズに合った料金体系を選ぶようにしてください。この記事をもとにAzure OpenAI Serviceを最もコスト効率の高い方法で使用し、新たな技術の実装において成功を収める助けとなることを期待しています。

Azure OpenAI Serviceの他の情報については、AI総合研究所の関連記事をご覧ください。