この記事のポイント
- 事前学習済みモデルによる請求書、領収書、名刺などの自動データ抽出
- カスタムモデル作成による業界固有文書の効率的な処理
- Power AutomateやLogic Appsとの連携による業務自動化
- OCR、レイアウト分析、フォーム認識などの高度な文書処理機能
- 多言語対応とセキュアなデータ処理による柔軟な運用
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
企業活動において、文書処理の自動化は業務効率化の重要な課題となっています。
Azure Form Recognizer(現:Azure AI Document Intelligence)は、AIを活用して文書からの情報抽出を自動化し、デジタル化を加速させるサービスです。
請求書、領収書、名刺など一般的な業務文書に対応した事前学習済みモデルに加え、業界固有の文書にも対応可能なカスタムモデルの作成機能を提供。高精度なOCRとレイアウト分析により、構造化された形式でデータを抽出します。
Power AutomateやLogic Appsとの連携により、抽出したデータを基幹システムに自動連携することも可能。多言語対応とセキュアなデータ処理により、グローバルな業務展開にも対応します。
本記事では、Azure Form Recognizerの主要機能から具体的な実装手順、活用シナリオまで、実務で即活用できる情報を体系的に解説します。文書処理の自動化に取り組む組織に、実践的なガイドを提供します。
目次
Azure AI Document Intelligenceとは
Azure AI Document Intelligenceの主な機能
Azure AI Document Intelligenceの仕組み
Azure AI Document Intelligenceのメリット
Azure AI Document Intelligenceの使い方
ステップ2: Azure AI Document Intelligenceの作成
ステップ3: Document Intelligence Studioで手書き文字の読み取り
Azure AI Document Intelligenceの料金体系
Azure AI Document Intelligenceとは
Azure AI Document Intelligenceは、Microsoft Azureが提供するAIサービスです。書類やフォームのデータを自動的に読み取り、構造化データとして抽出する機能を備えています。
このサービスを利用することで、請求書、領収書、契約書、IDカードなど、さまざまな形式の文書を迅速かつ正確に処理することが可能です。
Azure AI Document Intelligenceイメージ
Azure AI Document Intelligenceの主な機能
ここでは、Azure AI Document Intelligenceが提供する主要な機能についてご説明します。
1. ドキュメント分析
ドキュメント分析は、ドキュメント内のテキストやレイアウト構造を自動的に検出・抽出する機能です。
テーブルやチェックボックス、オブジェクトなどの複雑なデータを含む文書も正確に解析し、必要な情報を簡単に取り出すことができます。
- 文書全体のレイアウト構造を解析
- テキスト、表、構造データの自動抽出
- 書式に依存しない汎用性
スキャンした契約書や報告書からテキストと表を同時に抽出し、分析に活用することができます。
(出典元:公式ホームページ)
2. カスタムモデル
カスタムモデルは、ユーザー独自のフォーマットや文書タイプに合わせてデータ抽出を最適化する機能です。
抽出したいフィールドを定義し、少量のサンプルドキュメントを提供するだけで、カスタムモデルを作成可能です。
- 任意の文書フォーマットに対応
- 少量のトレーニングデータでモデル作成が可能
- REST APIや各種SDKを活用し、幅広いシステムに簡単に組み込む
特定業界の独自フォーム(例えば保険の申請書)を処理するモデルを構築することができます。
カスタムモデルイメージ(参考:マイクロソフト)
3. 事前構築モデル
事前構築モデルは、特定の一般的なドキュメントタイプ(領収書、請求書、名刺、パスポート、IDカードなど)に対応したモデルです。
すでにトレーニング済みのモデルを使用するため、すぐに情報抽出が可能です。
- 特定の文書タイプに最適化されたモデルを利用可能
- 導入時のコストと時間を削減
- 高い精度で情報を抽出可能
世界共通フォーマットのパスポート情報や請求書データを即座にデジタル化できます。
(出典元:公式ホームページ)
4.手書き文字の認識
手書き文字の認識は、OCR(光学文字認識)技術を使って、画像やドキュメントに含まれる手書きのテキストを読み取り、デジタルデータに変換する仕組みです。
スキャンした書類やフォームに手書きで記入された情報を自動で抽出することができ、紙のデータをデジタル化する際に役立ちます。
- 手書きのテキストやサインなど、活字ではない情報も認識可能
- 複雑な手書きや筆跡があっても高い精度で読み取りできる
紙の申請書やアンケートに手書きされた情報を自動で読み取ってデジタル化することができます。
5.ドキュメント分類
ドキュメント分類は、さまざまな種類の書類を自動で認識し、分類する機能です。この機能を使うことで、請求書、領収書、契約書など、異なるドキュメントを簡単に区別し、それぞれに適した処理を自動で適用できます。
- あらかじめ分類するドキュメントの種類を設定するだけで、異なるフォーマットや内容の書類を正確に仕分けできます。
- 業務に合わせて設定を変更することができます。特殊なドキュメント形式や特定の業界向け書類にも対応可能です。
Azure AI Document Intelligenceの仕組み
ここではAzure AI Document Intelligenceの仕組みについてわかりやすく説明します。
入力データのフォーマット
Azure AI Document Intelligenceは、以下のようなさまざまな形式のドキュメントを処理できます。
対応するファイル形式
- PDF(スキャンされたものやデジタル形式のどちらも対応)
- 画像ファイル(JPEG、PNG、TIFFなど)
- 手書き文書(OCR技術を活用して対応可能)
処理フロー
ドキュメントを入力すると、以下のステップで処理が進みます。
1. ドキュメントのアップロード
- REST API、SDK、またはAzureポータルを使ってファイルをアップロードします。
2. ドキュメントの解析
- AIがドキュメントの内容を読み取り、必要なデータ(テキスト、表、項目など)を検出します。
- 必要に応じて以下を選択します。
- 事前構築済みモデル(例: 請求書用)
- カスタムモデル(自社専用のフォーマット用)
3. 情報の抽出
- ドキュメント内のテキストや表、手書き文字を整理し、データを抽出します。
- レイアウトやフォーマットを理解し、正確にデータを取得。
4. データの出力
- 解析した結果は、JSON形式で出力され、他のシステムと簡単に連携できます。
Azure AI Document Intelligenceのメリット
Azure AI Document Intelligenceを導入することで、以下の多くのメリットが得られるでしょう。
業務効率化
従来、ドキュメント処理では多くの手作業が必要でしたが、このツールを使うことで大幅な効率化が実現します。自動でドキュメントを分類し、必要なデータを抽出するため、人間が一つひとつ確認したり入力したりする手間が減ります。
コスト削減と時間短縮
ドキュメント処理の自動化により、人的リソースの負担を軽減し、コストを削減します。また、迅速な処理が可能になるため、プロジェクト全体の進行がスムーズになります。
高精度なデータ抽出
AI技術を活用しているため、ドキュメントから必要な情報を高い精度で取得することができます。
さまざまなフォーマットへの対応
Azure AI Document Intelligenceは、請求書や領収書、契約書、IDカードなど、さまざまな形式のドキュメントを処理できます。また、カスタムモデルを使用すれば、業界特有のフォーマットや独自書類にも対応可能です。
Azure AI Document Intelligenceの使い方
ここでは、Azure AI Document Intelligenceの利用手順について順を追ってご紹介します。
今回は簡単な例として手書き文字の読み取りを紹介します。
ステップ1: Azureポータルにサインイン
- Azureポータルにアクセスし、Azureアカウントでサインインします。
Azureポータル画面
ステップ2: Azure AI Document Intelligenceの作成
- Azureポータル画面の「リソースの作成」で「azure ai document intelligence」で検索し、「Document Intelligence (form recognizer)」をクリックします。
DocumentIntelligence選択画面
- 「Create Document Intelligence」画面、「基本」タブで適切な設定をします。
「次へ 」をクリックします。
基本タブ画面
- 「ネットワーク」タブで適切な設定をします。
「次へ 」をクリックします。
ネットワークタブ画面
- 「Identity」タブで適切な設定をします。
「確認と作成」をクリックします。
Identityタブ画面
- 「確認と作成」タブで適切な設定をします。
「作成」をクリックします。
確認と作成タブ画面
- デプロイ完了後、「リソースに移動」をクリックします。
デプロイ完了画面
ステップ3: Document Intelligence Studioで手書き文字の読み取り
- 作成したリソース画面において「Go to Document Intelligence Studio」をクリックします。
DocumentIntelligenceStudio設定画面
- 「Read」をクリックします。
Read選択画面
- 初期設定画面において、適切な設定をします。
「Continue」をクリックします。
DocumentIntelligenceStudio初期の設定画面
- 「Read」画面において、「Drag & Drop file」に解析したいファイルをドラッグアンドドロップします。
Read画面
- 「Run analysis」をクリックします。
画像ファイル読み込み画面
- 解析結果が出力されます。
解析画面
Azure AI Document Intelligenceの料金体系
Azure AI Document Intelligenceの料金体系では、主に以下の2つの支払い方法を選ぶことができます。
-
従量課金制
使用した分だけ料金を支払うモデルです。各機能ごとに処理したページ数に応じて課金されます。
例えば、事前構築済みモデルの利用では、1,000ページあたりの料金が設定されています。
-
コミットメント レベル
大量の使用を予定している場合、前払いで月額料金を支払うことで割引を受けられるモデルです。 特定のページ数を事前に購入し、超過分は追加料金が発生します。
具体的な料金は、選択する機能や使用量、リージョンによって異なります。
最新の詳細情報や正確な料金については、公式価格ページをご確認ください。
Azure AI Document Intelligenceの活用事例
Azure AI Document Intelligenceは、さまざまな業界や業務プロセスで活用できる柔軟性を持ったツールです。ここでは、具体的な利用シナリオを説明します。
請求書や領収書の処理
日々大量に発生する請求書や領収書の処理を自動化し、効率化することができます。書類から金額、日付、取引先情報などを正確に抽出し、会計システムに直接統合することが可能です。
具体例:
請求書から取引明細を抽出し、財務システムに自動で登録できます。
契約書や法務文書の分析
契約書や法的書類には重要な情報が多く含まれています。Azure AI Document Intelligenceを活用することで、こうした文書から特定の条項や重要なデータを自動的に抽出することができます。
具体例:
契約書から契約期間や主要条項を抽出し、契約管理システムに保存することができます。
フォームデータの統合
紙や電子フォームのデータを統合し、効率的に処理することも可能です。申込書やアンケートなどから手書きや印刷された情報をデジタル化し、バックエンドシステムに反映することができます。
具体例:
顧客の申込書から名前や住所を自動抽出し、CRM(顧客管理システム)に登録。
小売・物流分野での応用例
小売業や物流業では、大量の書類(出荷指示書、受領書、発注書など)が日常的に発生します。このツールを使えば、こうした書類から必要なデータを自動で取得し、運用システムに統合することができます。
具体例:
発注書から注文内容を抽出し、在庫管理システムに反映できます。
まとめ
本記事では、Azure AI Document Intelligenceについて、その基本概念から主要機能、メリット、具体的な活用事例まで幅広く解説しました。
Azure AI Document Intelligenceは、は、Microsoft Azureが提供するAIベースのサービスで、文書やフォームからデータを自動的に抽出し、構造化データとして処理する機能を備えています。紙やPDF、画像形式の文書を迅速にデジタルデータ化することで、業務の効率化を実現します。申請書類の処理自動化、請求書のデジタル化、顧客情報の効率的な管理など広い業界や用途で利用されています。
ぜひAzure AI Document Intelligenceを活用することで、業務プロセスの自動化や効率化を実現してください。今後のAI技術の進化とともに、Azure AI Document Intelligenceの機能はさらに拡張され、企業のデジタルトランスフォーメーションを加速させる重要なツールとしての役割が期待さることでしょう。
本記事が皆様のお役に立てたら幸いです。