AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

Azure OpenAIのOn Your Dataとは?料金や使い方、RAG構築手順を解説!

この記事のポイント

  • Azure OpenAI ServiceのOn Your Data機能を使って、 RAGを構築する方法を解説しています。
  • On Your Data と RAG の仕組み、データの準備方法、インデックスの構築、パラメーター設定などを学ぶことができます。
  • Azure OpenAI Service の RAG におけるトークン使用量の見積もり方や、役立つ外部リソースなども紹介しています。
  • 具体的な手順を通して、ビジネスプロセスの自動化や顧客サービスの向上など、On Your Data と RAG を活用した業務改善のヒントが得られます。

監修者プロフィール

坂本 将磨

Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。

Microsoft Azureが提供するAzure OpenAI Serviceは、最先端のAIモデルを用いて、特定の業務に適したソリューションを構築できる柔軟性を特徴としています。
特に、On Your Data 機能と RAG(Retrieval-Augmented Generation)を活用することで、独自のデータに基づくAIモデルのカスタマイズが可能になります。

本記事では、Azure OpenAI Service の On Your Data機能とRAGを活用し、自社データでAIモデルをカスタマイズする方法について具体的に解説します。

データの準備からサービスの利用開始、インデックスの構築、パラメーター設定に至るまで、詳細な手順をフォローします。
ビジネスプロセスの自動化、顧客サービスの向上など、AzureのAIを活かした業務改善へと繋げるヒントが豊富となっています。ぜひ最後までご覧ください。

Azureの基本知識や料金体系、利用方法についてはこちらの記事で詳しく解説しています。
➡️Microsoft Azureとは?できることや各種サービスを徹底解説

Azure OpenAI Service On Your Dataとは?

Azure OpenAI Serviceは、Azureのクラウドプラットフォームで提供されるサービスです。OpenAIの先進的な自然言語処理モデルを活用し、様々な自然言語タスクを簡単に実装できます。
しかし、汎用的なモデルでは、社内データや専門的な内容についての応答は得られません。

そこで、On Your Data機能を利用することで、自身で用意したデータを言語モデルに組み込むことができます。
これにより、ビジネスに特化したカスタムAIモデルを開発し、特定のニーズや要求に合わせた高精度の結果を得ることが可能になります。

On Your Dataは、Azure OpenAI Serviceの強力な機能で、企業や組織がAIを自社のユースケースに適用することを可能にします。

独自データに基づくAIモデルは、業界特有の課題解決に大きく貢献すると期待されています。


Azure On Your Dataでできること

Azure OpenAI ServiceのOn Your Data機能を活用することで、RAG (Retrieval-Augmented Generation) の構築を簡単に実現できます。


この機能により、以下のようなことが可能になります。

  1. 独自データに基づくカスタムAIモデルの構築
    • 自社の製品情報、サービス内容、社内ドキュメントなどの独自データを学習させることで、ビジネスに特化したAIモデルを構築できます。

  2. ドメイン固有の知識を持つAIアシスタントの開発
    • On Your Data で学習させたモデルを使用することで、特定の分野に精通したAIアシスタントを開発できます。
      顧客サポート、社内ヘルプデスク、専門的な質問応答システムなどに活用できます。

  3. リアルタイムな情報検索と知識抽出
    • 大量の社内ドキュメントや製品情報を学習させたモデルを用いることで、必要な情報をリアルタイムに検索・抽出できます。
      情報のアクセシビリティが向上し、業務効率化が期待できます。

  4. ビジネスプロセスの自動化
    • On Your Data で学習させたモデルを活用することで、業務フローの一部を自動化できます。
      例えば、問い合わせ内容に応じて適切な部署へ自動転送するシステムや、定型業務の自動化などが可能です。


これらは Azure OpenAI ServiceのOn Your Data機能を活用することで実現できる一例です。

独自データを活用することで、ビジネスに特化したAIソリューションを構築し、業務効率化やサービス品質の向上を図ることができるでしょう。


Azure On Your Dataの使い方

Azure OpenAI Serviceとその関連サービスを用いた、On Your Dataの利用方法を説明します。
基本的な操作は、Azure OpenAI Serviceの利用プラットフォームであるAzure OpenAI Studioを利用します。

そのためAzureのサブスクリプションリソースグループは既に作成済みで、Azure OpenAI Studioが利用可能であることを前提とします。

【Azure OpenAI Stduioの使い方】

Azure OpenAI Studioの始め方や料金体系、デプロイ方法を徹底解説 | AI総合研究所

Azure OpenAI Studioについて、その概要や利用方法、主要機能を掘り下げて解説します。AI開発を加速させる方法を学び、あなたのプロジェクトへの応用を見つけましょう。

https://www.ai-souken.com/article/azure-openai-studio-explanation

【サブスクリクションとリソースグループの説明】

Azureのリソースグループとは?作成や移動、アクセス権限の管理を解説 | AI総合研究所

Azureリソースグループを理解し、運用管理を効率化。役割や活用方法をわかりやすく解説し、リソース管理の合理化やコスト削減へ導くポイントを紹介します。

https://www.ai-souken.com/article/azure-resource-groups-explanation

データ保管用のストレージの作成

On Your Dataの利用には、利用するデータの保管場所が必要となります。データの保管にはAzure Blob Storageを利用します。

未作成の場合は、以下の手順でストレージアカウントを作成してください。

  1. Azureポータルにログインし、検索欄にストレージアカウントと入力します。

  2. 「作成」ボタンをクリックし、必要な情報を入力してストレージアカウントを作成します。
    ストレージアカウントの作成
    ストレージアカウントの作成

  3. 作成したストレージアカウントを選択し、コンテナーを作成します。そして、アップロードからデータをアップロードしてください。
    データのアップロード
    データのアップロード


Azure Blob Storageの利用方法が不明な場合は、こちらの記事をご覧ください。
➡️Azure Blob Storageとは?アクセス方法や使い方を徹底解説!

Azure AI Serachリソースの作成

Azure AI Searchは、カスタムアプリケーションに対して強力かつ高度な検索機能を提供するクラウドベースの検索サービスです。



Azure AI Searchリソースの作成
Azure AI Searchリソースの作成

Azure OpenAI Studioでのデータの追加

Azure OpenAI Studioでのデータの追加を行います。Azure OpenAI Studioホームからデータの追加を選択します。
Azure OpenAI Studioホーム
Azure OpenAI Studioホーム


データの追加画面では先ほど作成したBlob Storageとコンテナ、AI Searchのリソースなどの設定をします。
データの追加
データの追加設定


設定が完了したら、チャットプレイグラウンドに移動します。設定メニューの「データの追加」セクションに、追加したコンテナの情報が表示されていれば、データの追加は成功です。

これで、独自データを使ったチャットボットの開発を始められます。


Azure OpenAI On your Dataを使ったRAGの構築手順

ここでは、サンプルデータとしてContoso Electronicsの医療サービスプランに関する文書を使用します。
このデータはこちらのGithubリポジトリ(Azure Samples)からダウンロードできます。

サンプル文書データ
サンプル文書データ


データを追加したモデルに、「Northwind Health Plusについて日本語で教えて」と質問してみました。応答は次のようになりました。

 Northwind Health PlusはContoso Electronicsが提供する包括的なプランです。
 このプランは医療、視力、歯科サービスのカバレッジを提供し、処方薬のカバレッジ、メンタルヘルスおよび薬物乱用のカバレッジ、予防医療サービスのカバレッジも含まれています。

Northwind Health Plusでは主治医、専門医、病院、薬局などさまざまなネットワーク内のプロバイダーから選択することができます。
このプランはネットワーク内およびネットワーク外の緊急サービスのカバレッジも提供しています。Northwind Standardと比較して、Northwind Health Plusはメンタルヘルスおよび薬物乱用のカバレッジ、さらに幅広い範囲の処方薬のカバレッジなどより包括的なカバレッジを提供しています。

また、視力検査、メガネ、コンタクトレンズ、歯科検診、クリーニング、詰め物のカバレッジも提供しています。入院、診察、検査、レントゲンなどのカバレッジもあります。
全体的に、Northwind Health Plusはさまざまな医療ニーズに対して包括的なカバレッジを提供するプランです。


応答から、モデルが文書の内容を参照し、質問されたプランの説明だけでなく、文書内の他のプランとの比較についても言及していることがわかります。

比較のために、同じ質問をChatGPTに投げてみました。ChatGPTの応答は次のようになりました。

Northwind Health Plus(ノースウィンドヘルスプラス)は、日本の健康食品メーカーです。同社は、健康とウェルネスをサポートするための高品質な製品を提供しています。


ChatGPTはデータを参照できないため、的外れな回答(ハルシネーション)が生成されてしまいました。ハルシネーションとは、言語モデルが誤った情報を確信を持って生成してしまう現象のことです。
(もちろん、Northwind Health Plusという日本の健康食品メーカーは存在しません)

このように、Azure OpenAI ServiceのOn Your Data機能を使ってRAGを構築することで、独自データに基づく正確で詳細な応答を生成できるようになります。


Azure On Your Dataの料金体系

Azure OpenAI Service On Your Dataの料金体系は、使用するリソースやデータ量に応じて異なります。

主な料金体系は以下の通りです。

項目 説明
コンピューティング モデルのトレーニングや推論に使用するコンピューティングリソースの料金
ストレージ データの保存に使用するストレージの料金
データ転送 データの転送に関連する料金
APIコール モデルへのリクエスト数に基づくAPIコールの料金

料金は、使用量に応じて従量課金制で請求されます。詳細な料金情報や見積もりについては、Azureの料金計算ツールを使用するか、Azureの販売チームにお問い合わせください。


Azure On Your Data の活用例

On Your Dataによって自身で用意したデータを言語モデルに組み込むことで、顧客サポートの自動化リアルタイムのドキュメント検索などの活用例が考えられます。

顧客サポートの自動化

ChatGPTなどの自然言語処理AIを用いることでユーザーとの対話が可能ですが、「対話の中でユーザーから、モデルが学習していないデータに関する情報を聞かれた場合」従来のモデルでは適切に対応することが出来ません。

On Your Dataを活用し、企業の独自のデータを学習させることで、この問題を解決できます。
顧客からの製品に関する質問やトラブルシューティングの要求に対して、チャットボットが即座に詳細な回答を提供できるようになります。

これにより、顧客満足度の向上とサポートチームの業務効率化を同時に実現できます。

リアルタイムのドキュメント検索

On Your Dataは顧客サポートだけでなく、組織内ナレッジ管理にも活用できます。
社内ドキュメントや取扱商品の関連資料は膨大な量になることが多く、全てを個人が把握するのは困難です。

そこで、それらのドキュメントをモデルに学習させることで、必要な情報をリアルタイムにAIに問い合わせられるようになります。

On Your Dataを使えば、AIがドキュメントの内容を深く理解し、質問の文脈に合わせて適切な情報を抽出、提示してくれます。

これにより、社内の情報アクセシビリティが大幅に向上し、ナレッジ共有と業務効率化が進むでしょう。

その他の活用シーン

上記以外にも、On Your Dataは様々な場面で活用できます。例えば、医療分野では患者のカルテデータを学習させることで、診断サポートや治療方針の提案に役立てられるでしょう。

また、法律分野では過去の判例データを学習させることで、弁護士の調査業務を支援できる可能性があります。

On Your Dataは、企業や組織が持つ固有のデータ活用を促進し、AIの導入による業務改革を加速させる強力なツールだと言えます。


まとめ

本記事では、Azure OpenAI ServiceのOn Your Data機能について詳しく解説しました。
On Your Dataを使うことで、企業や組織が持つ独自のデータを言語モデルに学習させ、ビジネスに特化したAIアプリケーションを構築できます。

On Your Dataを活用してカスタマイズされたAIモデルは、特定の業界や業務に特化した知識を持ち、ビジネスに直結する課題解決に大きく貢献すると期待されます。
企業や組織がAIの導入を検討する際、On Your Dataは非常に有力な選択肢の一つになるでしょう。

本記事が、読者の皆様にとってOn Your Dataの理解を深める一助となり、AIを活用したビジネス革新のアイデアを喚起する機会になれば幸いです。

AI活用のノウハウ集「AI総合研究所」サービスご紹介資料

「AI総合研究所 サービス紹介資料」は、AI導入のノウハウがないというお客様にも使いやすい最先端のAI導入ノウハウを知れる資料です。

資料ダウンロード
監修者

坂本 将磨

Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。

関連記事

AI導入の最初の窓口。

お悩み・課題に合わせて活用方法をご案内いたします。
お気軽にお問合せください。

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!