この記事のポイント
- Azure OpenAI Serviceの料金体系を、リージョンとモデルごとに詳細に解説
- 言語モデル、ベースモデル、微調整モデル、画像モデル、埋め込みモデル、音声モデルの各カテゴリにおける具体的な料金を提示
- トークン単位やコンピューティング時間単位など、各モデルの課金方式の違いを説明
- Azure Portalを通じたAzure OpenAI Serviceの購入手順を7つのステップで解説
- Azureの料金計算ツールの使用方法と、正確な料金見積もりを出すためのパラメータ設定のポイントを紹介
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
Azure OpenAI Serviceは、クラウド経由で豊富なAI機能を提供し、インテリジェントなアプリケーション構築を可能にするサービスです。しかし、その利用料金の仕組みは複雑で、把握しづらいと感じる方も多いのではないでしょうか。
本記事では、Azure OpenAI Serviceを運用する上で欠かせない料金体系について、初心者にもわかりやすく、詳細に解説します。使用するリージョンやモデルに応じた料金の違いを明確に示し、料金計算ツールの使い方やコスト削減のためのヒントも紹介します。
これから、AzureのクラウドAIサービスを活用しようと考えている方や、すでに利用中の方で料金面での最適化を目指している方にとって、この記事は非常に有益な情報源となるでしょう。
Azure OpenAI Serviceの料金についての疑問を解決し、効率的かつ予算に合ったサービス運用を実現するために、ぜひ参考にしてください。
Azureの基本知識や料金体系、利用方法についてはこちらの記事で詳しく解説しています。
➡️Microsoft Azureとは?できることや各種サービスを徹底解説
Azure OpenAI Serviceとは
Azure OpenAI Serviceは、Azure AIサービスのうちの1つで、Microsoft Azure上で提供されるOpenAIの強力なAIモデルを利用できるサービスです。
OpenAIのAIモデル(GPT-4、GPT-3.5、DALL-Eなど)がAzure上で提供されるので、テキスト、音声、画像生成といった高度なAI機能を活用することができます。
Azure OpenAI Serviceイメージ
Azure OpenAI Serviceは、企業の規模やユースケースに応じて、柔軟にプランやモデルを選択できるようになっており、コストを抑えながらもAI機能の導入を試すことが可能です。たとえば、小規模のスタートアップが初期費用を最小限にしながらAI技術を試験的に導入したり、大企業が高性能なAIモデルを活用して業務の自動化や分析を強化したりするなど、利用の幅が広がっています。
今回の記事では、こうした多様な用途に対応できるAzure OpenAI Serviceの料金体系について詳しく解説します。
【関連記事】
➡️Azure AI Services解説記事
Azure OpenAI Serviceの料金体系の概要
Azure OpenAI Serviceの料金は、ユーザーが使用する料金プラン・デプロイメント・モデルによって異なります。
そこでまず最初に、こうした概念について説明をします。
料金プラン
Azure OpenAI Serviceには、以下の3つの料金プランがあります
-
standard(従量課金制)
使用した入力・出力トークンに対して「Pay-as-you-go(ペイ・アズ・ユー・ゴー)」方式で課金されます。使用量に応じた課金で柔軟に利用可能です。 -
Provisionedプラン(PTU)
一定のスループット(処理能力)を確保する予約型の支払い方法です。月単位や年単位での予約が可能で、予測可能なコストで利用することができ、全体のコスト削減も可能です。特定の要件を持つ企業向けプランとなります。 -
バッチAPI
大規模な導入向けに、24時間以内に処理を返すバッチ処理オプションで、スタンダード料金より50%割引となります。利用には特定の条件や契約が必要です。
デプロイメント
デプロイメントとは、アプリやサービスを「どこで」「どのように」稼働させるかを決定することです。Azure OpenAI Serviceでは、以下のようにデプロイメントを選ぶことで、利用する場所や範囲を制御することができます。
グローバルデプロイメント(Global)
特定の地域に縛られず、Azureのグローバルネットワークを通じてデータ処理が行われます。
データゾーンデプロイメント(Data Zones)
特定の「データゾーン」に限定して利用するデプロイメントで、現在はEUまたはUSが選択可能です。
リージョナルデプロイメント(Regional)
特定の地域(27のリージョン)に限定してデプロイする選択肢です。細かく限定した特定地域でのデータ処理を行い、物理的に近い地域のデータセンターでデータが保管されます。
モデル
モデルとは、特定のAIタスク(テキスト生成、質問応答、埋め込み生成など)を実行するために訓練された特定のOpenAIのAIアルゴリズムを指します。このサービスでは、OpenAIが開発したさまざまなモデルを利用できますが、それぞれのモデルは異なる特徴や得意分野を持っているので、用途に応じて使い分けることが重要です。
詳細は次の章で後述します。
トークンとは
多くのモデルの料金単位に出てくるトークンという概念があります。
Azure OpenAI Serviceの多くの料金は、処理されたデータ量をトークン単位で測定し、その合計に基づいて請求されます。
【トークンとは?】
トークンは、テキストデータの単位です。単語やフレーズ、ピリオドなどの構成要素に分割されます。例えば、1つの単語が1トークンに相当する場合が多く、短い単語や記号は1トークン、それ以上の長い単語やフレーズが複数トークンにカウントされることがあります。
【1Mトークンあたりの料金】
サービスを利用するときは、データ処理に使われたトークンが100万単位で計算され、その単位ごとの料金が適用されます。例えば、「1Mトークンあたり¥500」の料金設定であれば、100万トークンごとに¥500が課金されます。
standard(従量課金制)の具体的な料金について
ここではstandard(従量課金制)の具体的な料金について、モデルごとにその特徴と共にご紹介していきます。
本記事では主に東日本リージョンでAzure OpenAI Serviceを利用した場合の試算を示します。
o1シリーズ
o1シリーズというモデルには、o1 Preview, o1 Miniがあります。複雑な推論タスク向けに設計されたモデルシリーズです。大規模なデータを処理する「コンテキストサイズ」が128Kあり、2023年10月時点の知識が反映されています。
o1 Preview
o1シリーズの新しいモデルで、複雑なタスクに対応する「推論」用のモデルです。データ分析や高度な推論処理が必要なタスクに適しています。
【モデル料金(1Mトークンあたり)】
- Globalデプロイメントでのキャッシュ済み入力に対してのみ料金が発生し、1Mトークンあたり¥1,151.1001です。
- 出力やその他の入力については課金対象外となっています。
キャッシュ済み入力とは、以前に処理された入力データや頻繁に使用される入力内容を、一時的に保存(キャッシュ)しておき、次回同じ内容を処理する際に再利用する仕組みです。これにより、同じ入力を複数回処理する際に計算コストや時間を削減できます。
o1 Mini
o1-miniは、o1シリーズの軽量版で、特にコーディング、数学、科学などの用途に効率的なモデルです。学術的な分析やコーディング支援など、処理の速さとコスト効率が重要な用途に向いています。
【モデル料金(1Mトークンあたり)】
- Globalデプロイメントでのキャッシュ済み入力に対して、1Mトークンあたり¥230.2201の料金が発生します。
- 出力やその他の入力については課金対象外となっています。
4oシリーズ
マルチモーダル対応で、テキストだけでなくビジョン(画像)も扱える高度なモデルです。GPT-4o、GPT-4o-Realtime-Preview、GPT-4o Miniがあります。
GPT-4o
GPT-4oは、GPT-4 Turboの改良版で、より高速でコスト効率が良く、視覚的な認識機能も強化されています。128Kのコンテキストサイズと2023年10月時点の知識が含まれています。より迅速で多機能な推論が必要なケース、視覚データ処理に最適です。
【モデル料金(1Mトークンあたり)】
Globalデプロイメントに対して以下の料金が発生します。その他については課金対象外となっています。
モデル | デプロイメント | データタイプ | 通常料金 | キャッシュ済み入力料金 |
---|---|---|---|---|
GPT-4o-2024-08-06 | Global | 入力 | ¥383.70001 | ¥191.8501 |
出力 | ¥1,534.8001 | 該当なし | ||
GPT-4o-0513 | Global | 入力 | ¥767.40001 | 該当なし |
出力 | ¥2,302.2001 | 該当なし |
GPT-4o-Realtime-Preview
Realtime API経由で提供されるモデルで、多言語音声変換などのリアルタイム音声機能をサポートしています。
【モデル料金(1Mトークンあたり)】
料金は以下のとおりです。
Model | Type | 入力料金 (¥/1M Tokens) | 出力料金 (¥/1M Tokens) |
---|---|---|---|
GPT-4o-Realtime-Preview-Global | Text | ¥767.4001 | ¥3,069.600004 |
Audio | ¥15,348.0001 | ¥30,696.000031 |
GPT-4o Mini
GPT-4oの軽量版で、小規模なモデルながら視覚認識機能を持ち、128Kのコンテキストサイズを活用しています。費用対効果が高く、比較的低コストで利用可能です。
【モデル料金(1Mトークンあたり)】
Globalデプロイメントに対して以下の料金が発生します。その他については課金対象外となっています。
デプロイメント | データタイプ | 通常料金 | キャッシュ済み入力料金 |
---|---|---|---|
Global | 入力 | ¥23.02201 | ¥11.5111 |
出力 | ¥92.0881 | 該当なし |
Base Models(ベースモデル)
ベースモデルは、Azure OpenAI Serviceにおける標準的なテキスト生成モデルであり、質問応答、要約、テキスト生成などの基本的なNLPタスクに適しています。汎用的なタスクに対応可能で、比較的安価な料金設定となっています。
代表モデルに、Davinci-002、Babbage-002があります。
モデル | 1,000トークンあたりの使用料金 |
---|---|
Babbage-002 | ¥0.0614 |
Davinci-002 | ¥0.3070 |
Fine-tuning Models(微調整モデル)
微調整モデルとは、Azure OpenAI Serviceにおいて、ユーザー固有のデータやニーズに合わせてカスタマイズ可能なモデルです。特定のドメイン、業界、あるいはアプリケーションで最適なパフォーマンスを発揮するように調整することができます。
これらのモデルは東日本リージョンでは利用できません(2024年11月現在)。利用できるリージョンであるアメリカ中北部での価格をお示します。
アメリカ中北部
モデル | トレーニング料金 (1,000トークンあたり) | ホスティング料金 (時間あたり) | 入力料金 (1,000トークンあたり) | 出力料金 (1,000トークンあたり) |
---|---|---|---|---|
Babbage-002 | ¥0.0614 | ¥260.917 | ¥0.0614 | ¥0.0614 |
Davinci-002 | ¥0.9209 | ¥260.917 | ¥0.3070 | ¥0.3070 |
GPT-3.5-Turbo (4K) | ¥1.2279 | ¥260.917 | ¥0.0768 | ¥0.2303 |
GPT-3.5-Turbo (16K) | ¥1.2279 | ¥260.917 | ¥0.0768 | ¥0.2303 |
GPT-4 (8K) | ¥12.2785 | ¥767.401 | ¥4.6045 | ¥9.2089 |
GPT-4o | ¥4.2208 | ¥260.917 | ¥0.4221 | ¥1.6883 |
GPT-4o-mini | ¥0.5065 | ¥260.917 | ¥0.025325 | ¥0.10130 |
自身のリージョンでの利用価格が知りたい方は、Microsoftの公式ドキュメントをご覧ください。
画像モデル
Azure OpenAI Serviceは、画像生成や画像処理に特化したモデルも提供しています。これらのモデルは、画像の分類、オブジェクト検出、画像生成などのタスクで効果を発揮し、様々なビジネスケースでの応用が可能です。
画像モデルは、東日本では利用できません(2024年11月現在)。利用できるリージョンであるアメリカ中北部での価格をお示します。
アメリカ中北部リージョン
モデル | 品質 | 解像度 | 価格 (100枚あたり) |
---|---|---|---|
Dall-E-3 | Standard | 1024 * 1024 | ¥613.921 |
Standard | 1024 * 1792, 1792 * 1024 | ¥1,227.841 | |
Dall-E-3 | HD | 1024 * 1024 | ¥1,227.841 |
HD | 1024 * 1792, 1792 * 1024 | ¥1,841.761 | |
Dall-E-2 | Standard | 1024 * 1024 | 該当なし |
モデルの埋め込み(Embedding)
このモデルは、テキストやデータを数値ベクトルに変換して、意味的な類似性を解析するモデルです。検索、推薦システム、類似度検索、データクラスタリングなどの用途に適しています。
AI技術における「埋め込み(embedding)」とは、テキスト、画像、音声などの複雑なデータを、機械学習モデルが扱いやすい形式である低次元の実数値ベクトルに変換することを指します。
料金体系は次のようになっています。
東日本リージョン
モデル | 価格 (1,000トークンあたり) |
---|---|
Ada | ¥0.015349 |
text-embedding-3-large | 該当なし |
text-embedding-3-small | ¥0.003070 |
音声モデル
音声認識や音声合成のためのモデルでは、音声データからテキストへの変換や音声合成を実現し、音声アシスタントなどに活用することができます。
これらのモデルは東日本リージョンでは利用できません(2024年11月現在)。
利用できるリージョンであるアメリカ中北部での価格をお示します。
アメリカ中北部
モデル | 価格 |
---|---|
Whisper | 該当なし / 時間あたり |
TTS (Text to Speech) | ¥2,302.21 / 100万文字 |
TTS HD | ¥4,604.41 / 100万文字 |
自身のリージョンでの利用価格が知りたい方は、Microsoftの公式ページもご覧ください。
従量課金制以外の具体的料金について
上記でもご紹介しましたが、料金プランには従量課金制以外にもProvisionedプランとバッチAPIがあります。ここでは、そうした料金プランでの具体的金額についてお伝えします。
Provisionedプランの概要
Provisionedプランでは、特定のモデルに対してスループット(処理能力)を予約することで、予測可能なパフォーマンスと安定した容量を確保できます。利用量に関係なく、モデルごとに1時間ごとの固定料金が発生しますが、月間または年間の予約で追加割引を受けることができます。
【PTUについて】
なお、ProvisionedプランではPTU(Provisioned Throughput Unit)という単位を使っています。PTUとは、Azure OpenAI Serviceで特定の処理能力(スループット)を事前に予約・確保するための単位です。
【PTU料金(1時間あたり / 月間 / 年間予約料金)】
料金は、以下のとおりです。
モデル | 最小PTU数 | PTU時間単価 | PTU月額予約料金 | PTU年額予約料金 |
---|---|---|---|---|
GPT-4o Regional | 50 | ¥306.9601 | ¥39,904.8001 | ¥407,028.9605 |
GPT-4o Mini Regional | 25 | ¥306.9601 | ¥39,904.8001 | ¥407,028.9605 |
バッチAPIプラン
このプランは一度に大量のデータをまとめて処理するためのオプションで、コスト効率と処理能力に優れています。リアルタイム性が必要ない場合のデータ処理に最適です。
このプランは東日本リージョンでは利用できません(2024年11月現在)。
利用できるリージョンであるアメリカ東部での価格をお示します。
アメリカ東部では、GlobalデプロイメントでのみバッチAPI料金が設定されており、その他では利用不可です。
アメリカ東部
モデル | デプロイメント | 入力料金 (1Mトークンあたり) | 出力料金 (1Mトークンあたり) |
---|---|---|---|
GPT-4o-2024-08-06 | Global | ¥191.85001 | ¥767.4001 |
GPT-4o-0513 | Global | ¥383.70001 | ¥1,151.1001 |
GPT-4o Mini | Global | ¥11.51101 | ¥46.0441 |
Azure OpenAI Servicesの作成手順
さて、ここからは実際の作成手順についてご紹介します。
※ 前提準備
以下を用意する必要があります。
- Azureアカウント、サブスクリプション、リソースグループ
- AIモデルをデプロイするためのアクセス許可
アカウント作成についてはこちらもご覧ください。
【関連記事】
➡️Azure Portalとは?操作方法やメリットをわかりやすく解説!
ステップ1: Azureポータルにサインイン
- Azureポータルにアクセスし、Azureアカウントでサインインします。
Azureポータル画面
ステップ2: Azure OpenAI Serviceの作成
- Azureポータル画面の「リソースの作成」で"Azure OpenAI"で検索し、「Azure OpenAI」をクリックします。
AzureOpenAI選択画面
- 「Azure OpenAIの作成」画面、「基本」タブで適切な設定をします。
※Azure Open AI Serviceの価格レベルによって料金が異なります。ここではstandardを選択します。
「次へ」をクリックします。
基本タブ画面
- 「ネットワーク」タブで適切な設定をします。
「次へ」をクリックします。
ネットワークタブ画面
- 「Tags」タブで適切な設定をします。
「次へ」をクリックします。
Tagsタブ画面
- 「レビューおよび送信」タブで設定に問題がないことを確認します。
「作成」をクリックします。
レビューおよび送信タブ画面
- デプロイ完了後、「リソースに移動」をクリックします。
デプロイ完了画面
ステップ3: モデルのデプロイ
AIモデルをデプロイして利用可能にするプロセスです。ここでは、Azure OpenAI サービスで提供されるさまざまな AI モデルを選択し、選択したモデルを独自の環境にデプロイすることで利用準備を整えることができます。
- 作成したAzure OpenAI Serviceから、「モデルデプロイ」をクリックします。
モデルデプロイ選択画面
- 「展開の管理」をクリックすると、Azure OpenAI Studioを利用することができます。
展開の管理選択画面
Azure OpenAI Studioは、Azure OpenAI Serviceを使ってモデルのテストや設定を行うためのブラウザベースのインターフェースです。開発者やビジネスユーザーが、Azure上で提供されているAIモデル(GPTなど)を使いやすくするために設計されています。
- Azure OpenAI Studioの画面より「モデルのデプロイ」をクリックします。
AzureOpenAIStudio画面
- いくつかの選択肢が表示されます。ここでは「基本モデルをデプロイする」を選択しました。クリックすると、Azureで利用できる幅広いモデルの中から、微調整されていない標準的なモデルを選んでデプロイすることが可能です。
基本モデルをデプロイする画面
- AIのモデルを選択することができます。選択したモデルによって料金も異なるため、コスト面も考慮しながら選択する必要があります。
基本モデル画面
- Azure OpenAI Studio には、利用可能なモデルが一覧表示されているモデルカタログがあります。カタログでは、用途や性能、料金に応じたさまざまなモデルの詳細情報を確認することができます。
「モデルカタログへ移動します」をクリックします。
モデルカタログ移動画面
モデルカタログ画面
Azureの料金計算ツール
Azure OpenAI Serviceを利用する際の料金を計算し見積もるためには、Microsoftが提供する料金計算ツールを使用することが有効です。具体的には、API呼び出しの頻度、使用するモデルの種類、データの量などのパラメータをユーザーが入力すると、それに基づいて料金が計算されるシステムです。
Azure OpenAI Serviceの料金計算ツール
【関連記事】
➡️ Azureの料金計算ツールの利用方法!基本機能や円表示の手順を解説
まとめ
本記事ではAzure OpenAI Serviceの料金体系の概要・言語モデル・料金プランについて説明しました。また料金を簡単に計算するための計算ツールについても説明しました。
Azure OpenAI Serviceは、Microsoft Azure上で提供されるAzure AIサービスの1つで、OpenAIの高度なAIモデル(GPT-4、GPT-3.5、DALL-Eなど)を利用できるサービスです。このサービスにより、テキスト生成、音声認識、画像生成など、さまざまな高度なAI機能をAzure上で簡単に活用できます。
ぜひAzure OpenAI Serviceを導入する際には、上記料金体系を参考にし、ニーズに合った料金体系を選ぶようにしてください。この記事をもとにAzure OpenAI Serviceを最もコスト効率の高い方法で使用し、新たな技術の実装において成功を収める助けとなることを期待しています。
Azure OpenAI Serviceの他の情報については、AI総合研究所の関連記事をご覧ください。