Foundry Tools における Azure ドキュメント インテリジェンスとは何ですか?

このコンテンツは適用対象:チェックマークv4.0 (GA) | 以前のバージョン:青チェックマークv3.1 (GA)赤チェックマークv3.0 (廃止)赤チェックマークv2.1 (廃止)

このコンテンツは適用対象です:チェックマークv3.1 (GA) | 最新バージョン:purple-checkmarkv4.0 (GA) | 以前のバージョン:blue-checkmarkv3.0blue-checkmarkv2.1

このコンテンツは適用対象:red-checkmarkv3.0 (廃止) | 最新バージョン:purple-checkmarkv4.0 (GA)purple-checkmarkv3.1 | 以前のバージョン:blue-checkmarkv2.1 (廃止)

このコンテンツの適用対象:red-checkmarkv2.1 | Latest version:blue-checkmarkv4.0 (GA)

重要

  • ドキュメント インテリジェンス REST API v2.1 は、2027年 9 月 15 日にサポートが終了します。
  • ドキュメント インテリジェンス REST API 2022-08-31 v3.0 は、2029 年 3 月 30 日にサポートが終了します。
  • 運用環境の中断を回避するには、Azure Document Intelligence 2024-11-30 v4.0 に移行します。 詳細については、「 ドキュメント インテリジェンス移行ガイド」を参照してください。

Foundry Tools のドキュメント インテリジェンスAzureは、インテリジェントなドキュメント処理ソリューションの構築に使用できるクラウドベースの Foundry Tools サービスです。 さまざまなデータ型にまたがる大量のデータが、フォームとドキュメントに格納されます。 Azureドキュメント インテリジェンスを使用して、データの収集と処理の速度を効果的に管理できます。 Azureドキュメント インテリジェンスは、運用の改善、情報に基づくデータドリブンの意思決定、および対応されたイノベーションの鍵となります。 リージョン アクセスの詳細については、「 リージョン別の製品の可用性」を参照してください。

|✔️ ドキュメント分析モデル |✔️ 事前構築済みモデル |✔️ カスタム モデル |

ドキュメント分析モデル

ドキュメント分析 (一般的な抽出) モデルを使用すると、フォームやドキュメントからテキストを抽出し、組織のアクション、使用、または開発のために構造化されたビジネス対応コンテンツを返します。

読み取り |印刷されたテキストと手書きのテキストを抽出します。

レイアウト |テキスト、テーブル、およびドキュメント構造を抽出します。

読み取り |印刷された
と手書きのテキストを抽出します。

レイアウト |テキスト、テーブル、
およびドキュメント構造を抽出します。

一般的なドキュメント |テキスト、構造体、および
キーと値のペアを抽出します。

事前構築済みモデル

事前構築済みのモデルを使用すると、独自のモデルをトレーニングして構築しなくても、インテリジェントなドキュメント処理をアプリやフローに追加できます。

銀行取引明細書 |口座情報と詳細を銀行明細書から抽出します。

チェック |チェックから関連情報を抽出します。

契約 | 契約および当事者の詳細を抽出します。

クレジットカード |支払いカード情報を抽出します。

請求書 |顧客とベンダーの詳細を抽出します。

支払いスタブ |支払いスタブの詳細を抽出します。

レシート |販売トランザクションの詳細を抽出します。

米国税

米国の統一税 |サポートされている米国の税フォームから抽出します。

米国税 W-2 |課税対象の報酬の詳細を抽出します。

米国税 1098 |1098 バリエーションの詳細を抽出します。

米国税 1099 |1099 バリエーションの詳細を抽出します。

米国税 1040 |1040 バリエーションの詳細を抽出します。

米国住宅ローン

米国住宅ローン1003 |ローン申請の詳細を抽出します。

米国住宅ローン1004 |評価から情報を抽出します。

米国住宅ローン1005 |雇用の検証から情報を抽出します。

米国住宅ローン 1008 | ローン通達の詳細を抽出します。

米国住宅ローン開示 |最終決算ローン条件を抽出します。

個人識別

健康保険証 |保険の対象範囲の詳細を抽出します。

ID |検証の詳細を抽出します。

結婚証明書 |認定された結婚情報を抽出します。

請求書 |顧客
とベンダーの詳細を抽出します。

レシート |売上
トランザクションの詳細を抽出します。

ID |識別
と検証の詳細を抽出します。

健康保険証 |医療保険の詳細を抽出します。

名刺 |ビジネス用連絡先の詳細を抽出します。

契約 | 契約および当事者の詳細を抽出します。

米国税 W-2 |課税対象の
コンポーネントの詳細を抽出します。

米国税 1098 |1098 バリエーションの詳細を抽出します。

カスタム モデル

カスタム モデルは、ラベル付けされたデータセットを使用してトレーニングされ、ユース ケースに固有のフォームやドキュメントから個別のデータを抽出します。 スタンドアロンのカスタム モデルを組み合わせて、構成済みのモデルを作成できます。

フィールド抽出モデルを文書化する

✔️ ドキュメント フィールド抽出モデルは、ドキュメントからラベル付けされたフィールドを抽出するようにトレーニングされます。

カスタム ニューラル |混合型ドキュメントからデータを抽出します。

カスタム テンプレート |静的レイアウトからデータを抽出します。

カスタム構成済み |モデルのコレクションを使用してデータを抽出します。

カスタム分類モデル

✔️ カスタム分類子は、抽出モデルを呼び出す前にドキュメントの種類を識別します。

カスタム分類子 |抽出モデルを呼び出す前に、指定されたドキュメントの種類 (クラス) を識別します。

アドオン機能

ドキュメント インテリジェンスでは、ドキュメント抽出シナリオに応じて有効または無効にできるオプションの機能がサポートされています。

分析機能

モデル ID コンテンツ抽出 クエリ フィールド 段落 段落の役割 選択マーク テーブル キーと値のペア 言語 バーコード ドキュメント分析 数式* スタイル書体* 高解像度* 検索可能な PDF
prebuilt-read O O O O O O
prebuilt-layout O O O O O O
prebuilt-contract O O O O
prebuilt-healthInsuranceCard.us O O O O O
prebuilt-idDocument O O O O O
prebuilt-invoice O O O O O O
prebuilt-receipt O O O O O
prebuilt-marriageCertificate.us O O O O O
prebuilt-creditCard O O O O O
prebuilt-check.us O O O O O
prebuilt-payStub.us O O O O O
prebuilt-bankStatement O O O O O
prebuilt-mortgage.us.1003 O O O O O
prebuilt-mortgage.us.1004 O O O O O
prebuilt-mortgage.us.1005 O O O O O
prebuilt-mortgage.us.1008 O O O O O
prebuilt-mortgage.us.closingDisclosure O O O O O
prebuilt-tax.us O O O O O
prebuilt-tax.us.w2 O O O O O
prebuilt-tax.us.w4 O O O O O
prebuilt-tax.us.1040 (各種) O O O O O
prebuilt-tax.us.1095A O O O O O
prebuilt-tax.us.1095C O O O O O
prebuilt-tax.us.1098 O O O O O
prebuilt-tax.us.1098E O O O O O
prebuilt-tax.us.1098T O O O O O
prebuilt-tax.us.1099 (各種) O O O O O
prebuilt-tax.us.1099SSA O O O O O
{ customModelName } O O O O O

✓ - 有効
O - 省略可能
* - Premium 機能には追加コストが発生します

モデルと開発オプション

ドキュメント インテリジェンスを使用して、アプリケーションとワークフローのドキュメント処理を自動化し、データドリブン戦略を強化し、ドキュメント検索機能を強化します。 表のリンクを使用して、各モデルの詳細を確認し、開発オプションを参照します。

読む

Document Intelligence Studio を使用した読み取りモデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-read ● ドキュメントからテキストを抽出します。
データを抽出します
● 文書
のデジタル化● コンプライアンスと監査
● 翻訳前の手書きメモの処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

レイアウト

Document Intelligence Studio を使用したレイアウト モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
事前構築済みレイアウト ● ドキュメントからテキストとレイアウト情報を抽出します。
データを抽出します
● 構造別のドキュメントのインデックス作成と取得
● 財務および医療レポートの分析
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

一般文書(2023-10-31-previewで非推奨)

Document Intelligence Studio を使用した一般的なドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
事前構築済みドキュメント ● ドキュメントからテキスト、レイアウト、キーと値のペアを抽出します。
データとフィールドを抽出します
● キー/値ペア抽出
● フォーム処理
● 調査データの収集と分析
ドキュメントインテリジェンススタジオ
REST API

請求 書

Document Intelligence Studio を使用した請求書モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
事前構築済み請求書 ● 請求書からのキー情報の抽出.
データとフィールドを抽出します
● 買掛金処理
● 税の自動記録とレポート
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

領収 書

Document Intelligence Studio を使用したレシート モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
事前構築済みレシート ● レシートからキー情報を抽出します。
データとフィールドの抽出.
● レシート モデル v3.0 では、単一ページのホテルレシートの処理がサポートされています。
● 経費管理
● 消費者行動データ分析
● 顧客ロイヤルティ プログラム
● 商品返品処理
● 税記録とレポートの自動化
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

アイデンティティ (ID)

Document Intelligence Studio を使用した ID (ID) ドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-idDocument パスポートと ID カードからキー情報を抽出します。
伝票タイプ.
● 米国の運転免許証から保証、制限、および車両分類を抽出します。
● 顧客 (KYC) 金融サービスガイドラインのコンプライアンスを把握する
● 医療アカウント管理
● ID チェックポイントとゲートウェイ
● ホテルの登録
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

確認

Document Intelligence Studio を使用してモデル分析を確認する方法を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
プリビルトチェック ● 小切手から主要な情報を抽出します。
データとフィールドを抽出します
● 与信管理
● 自動貸付業者管理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

給与明細

Document Intelligence Studio を使用した支払いスタブ モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
既製の給与明細 ● 支払いスタブからキー情報を抽出します。
データとフィールドを抽出します
● 従業員給与明細の検証
● 雇用に対する不正行為の検出
● 税処理の自動化
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

銀行取引明細書

Document Intelligence Studio を使用した Bank ステートメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
プリビルト・バンクステートメント ● 銀行取引明細書からキー情報を抽出します。
データとフィールドを抽出します
● 税処理のユース ケース
● 自動会計管理
● 貸方借方管理
● ローン書類処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

健康保険証

Document Intelligence Studio を使用した医療保険カード モデルの分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-healthInsuranceCard.us ● 米国の健康保険証から重要な情報を抽出します。
データとフィールドを抽出します
● カバレッジと適格性検証
● 予測モデリング
● 価値ベースの分析
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

コントラクト モデル

Document Intelligence Studio を使用したコントラクト モデルの抽出を示すスクリーンショット。

モデル ID 説明 開発オプション
事前構築済みコントラクト ● 契約契約とパーティの詳細を抽出します。
データとフィールドを抽出します
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

クレジット カード モデル

Document Intelligence Studio を使用したクレジット カード画像モデルの分析を示すスクリーンショット。

モデル ID 説明 開発オプション
プリビルト・クレジットカード ● 契約合意と当事者の詳細を抽出します。
データとフィールドを抽出します
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

結婚証明書モデル

Document Intelligence Studio を使用した結婚証明書ドキュメント モデルの分析を示すスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-marriageCertificate.us ● 契約合意と当事者の詳細を抽出します。
データとフィールドを抽出します
Document Intelligence Studio
REST API
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1003 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1003 ドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-mortgage.us.1003 ● 1003 ローン申請から重要な情報を抽出します。
データとフィールドを抽出します
Fannie Mae と Freddie Mac のドキュメント要件 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1004 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1004 ドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-mortgage.us.1004 ● 1004 件の評価から重要な情報を抽出します。
データとフィールドを抽出します
● Fannie Mae と Freddie Mac のドキュメント要件
● サブジェクトプロパティの市場価値を貸し手/顧客に役立つ均一住宅評価レポート
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1005 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1005 ドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-mortgage.us.1005 ●雇用の1005検証から重要な情報を抽出します。
データとフィールドを抽出します
● Fannie Mae と Freddie Mac のドキュメント要件
● 将来の mortgagor としての資格を決定するための雇用書類の検証
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン 1008 フォーム

Document Intelligence Studio を使用した米国住宅ローン 1008 ドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-mortgage.us.1008 ● 統一引受および転送概要から重要な情報を抽出します。
データとフィールドを抽出します。 概要データを使用したローン引受処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国住宅ローン開示フォーム

Document Intelligence Studio を使用した米国住宅ローンのクローズ開示ドキュメント モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-mortgage.us.closingDisclosure ● 統一引受および転送概要から重要な情報を抽出します。
データとフィールドを抽出します
住宅ローンの最終詳細要件 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 W-2 モデル

Document Intelligence Studio を使用した W-2 モデル分析を示すスクリーンショット。

モデル ID 説明 自動化使用例 開発オプション
prebuilt-tax.us.w2 IRS US W2 税フォーム (2018 年から 2021 年) から重要な情報を抽出します。
● 自動税務書類管理
● 住宅ローン申請処理
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1098 (およびバリエーション) フォーム

ドキュメント インテリジェンス スタジオで分析された US 1098 税フォームを示すスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1098{variation} 1098 形式のバリエーションから重要な情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1099 (およびバリエーション) フォーム

ドキュメント インテリジェンス スタジオで分析された US 1099 税フォームを示すスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1099{variation} 1099 形式のバリエーションから情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国税 1040 (およびバリエーション) フォーム

Document Intelligence Studio を使用した米国税 1040 税フォーム モデルの分析を示すスクリーンショット。

モデル ID 説明 開発オプション
prebuilt-tax.us.1040{variation} 1040 形式のバリエーションから情報を抽出します。
Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

米国の統一税フォーム

モデル ID 説明 開発オプション
prebuilt-tax.us サポートされているいずれかの米国税フォームから情報を抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

名刺

Document Intelligence Studio を使用した名刺モデル分析を示すスクリーンショット。

モデル ID 説明 自動化のユースケース 開発オプション
prebuilt-businessCard ● 名刺からキー情報を抽出します。
データとフィールドを抽出します
セールス リードとマーケティング管理 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript

カスタム モデルの概要

Document Intelligence Studio を使用したカスタム モデルトレーニングを示すスクリーンショット。

概要 説明 自動化のユースケース 開発オプション
カスタム モデル 代表的なトレーニング ドキュメント セットのセットから作成されたモデルに基づいて、フォームとドキュメントから構造化データに情報を抽出します。 ビジネスおよびユース ケースに固有のフォームやドキュメントから個別のデータを抽出します。 Document Intelligence Studio
REST API
C# SDKJava SDK
JavaScript SDK
Python SDK

カスタム ニューラル

Document Intelligence Studio を使用したカスタム ニューラル モデル分析を示すスクリーンショット。

メモ

カスタム ニューラル モデルをトレーニングするには、 buildMode プロパティを neural に設定します。 詳細については、「 ニューラル モデルのトレーニング」を参照してください。

について 説明 自動化のユースケース 開発オプション
カスタム ニューラル モデル 構造化 (アンケート、アンケート)、半構造化 (請求書、発注書)、および非構造化ドキュメント (コントラクト、レター) からラベル付きデータを抽出します。 構造化ドキュメントと非構造化ドキュメントからテキスト データ、チェック ボックス、および表形式フィールドを抽出します。 Document Intelligence Studio
REST API
C# SDK
Java SDK
JavaScript SDK
Python SDK

カスタム テンプレート

Document Intelligence Studio を使用したカスタム テンプレート モデル分析を示すスクリーンショット。

メモ

カスタム テンプレート モデルをトレーニングするには、 buildMode プロパティを template に設定します。 詳細については、「 テンプレート モデルのトレーニング」を参照してください。

概要 説明 自動化のユースケース 開発オプション
カスタム テンプレート モデル 構造化ドキュメントと半構造化ドキュメントからラベル付き値とフィールドを抽出します。
定義されたビジュアル テンプレートまたは一般的なビジュアル レイアウトとフォームを使用して、高度に構造化されたドキュメントからキー データを抽出します。 Document Intelligence Studio
REST API
C# SDK
Python SDK
Java SDK
JavaScript SDK

カスタム構成済み

概要 説明 自動化のユースケース 開発オプション
構成済みのカスタム モデル 作成されたモデルは、カスタム モデルのコレクションを取得し、フォーム型から構築された 1 つのモデルに割り当てることで作成されます。 複数のモデルをトレーニングし、それらをグループ化して、発注書などの同様のフォームの種類を分析する場合に便利です Document Intelligence Studio
REST API
C# SDKJava SDK
JavaScript SDK
Python SDK

カスタム分類モデル

Document Intelligence Studio でのカスタム分類モデルのラベル付けを示すスクリーンショット。

概要 説明 自動化のユースケース 開発オプション
構成済み分類モデル カスタム分類モデルは、レイアウト機能と言語機能を組み合わせて、入力ファイル内のドキュメントを検出、識別、分類します。 ● 申請フォーム、支払伝票、および銀行明細書を含むローン申請パッケージ
● スキャンされた請求書のコレクション
ドキュメント インテリジェンス スタジオ
REST API

Azure ドキュメント インテリジェンスは、開発者がインテリジェントなドキュメント処理ソリューションを構築するためのクラウドベースのFoundry Tools です。 Azureドキュメント インテリジェンスは、機械学習に基づく光学式文字認識 (OCR) とドキュメント理解テクノロジを適用して、ドキュメントからテキスト、テーブル、構造、およびキーと値のペアを抽出します。 また、カスタム モデルにラベルを付けてトレーニングし、構造化、半構造化、非構造化ドキュメントからのデータ抽出を自動化することもできます。 各モデルの詳細については、概念に関する記事を参照してください。

モデルの種類 モデル名
ドキュメント分析モデル レイアウト 解析モデル
事前構築済みモデル 請求書モデル
レシート モデル
ID (ID) モデル
名刺モデル
カスタム モデル カスタム モデル
構成済みモデル

このコンテンツの適用対象:red-checkmarkv2.1 | Latest version:blue-checkmarkv4.0 (GA)

ドキュメント インテリジェンス モデルと開発オプション

ヒント

エクスペリエンスの向上と高度なモデル品質については、 ドキュメント インテリジェンス v3.0 Studio をお試しください。

  • v3.0 Studio では、v2.1 ラベル付きデータでトレーニングされたすべてのモデルがサポートされます。
  • v2.1 から v3.0 への移行の詳細については、API 移行ガイドを参照してください。

各モデルの詳細を確認し、API 参照を参照するには、次の表のリンクを使用します。

モデル 説明 開発オプション
レイアウト分析 フォームとドキュメントからのテキスト、選択マーク、テーブル、境界ボックス座標の抽出と分析 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
カスタム モデル 個別のビジネス データとユース ケースに固有のフォームやドキュメントからのデータの抽出と分析 ドキュメント インテリジェンス ラベル付けツール
REST API
サンプル ラベル付けツール
ドキュメント インテリジェンス Docker コンテナー
請求書モデル 売上請求書からのキー情報の自動データ処理と抽出 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
レシート モデル 売上レシートからのキー情報の自動データ処理と抽出。 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
ID ドキュメント (ID) モデル 米国の運転免許証と国際パスポートからのキー情報の自動データ処理と抽出 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー
名刺モデル 名刺からのキー情報の自動データ処理と抽出 ドキュメント インテリジェンス ラベル付けツール
REST API
クライアント ライブラリ SDK
ドキュメント インテリジェンス Docker コンテナー

データのプライバシーとセキュリティ

すべての Foundry Tools と同様に、ドキュメント インテリジェンスを使用する開発者は、顧客データに対するMicrosoftポリシーに注意する必要があります。 詳細については、「 ドキュメント インテリジェンスのデータ、プライバシー、セキュリティ」を参照してください。