統合ランタイム (IR) は、Microsoft Purview がさまざまなネットワーク環境でデータ スキャンを実行するために使用するコンピューティング インフラストラクチャです。 この記事では、Microsoft Purview で使用できるさまざまな種類の統合ランタイムについて説明し、シナリオに適した統合ランタイム構成を選択する方法に関するガイダンスを提供します。
統合ランタイムの種類
Purview には、次の種類の統合ランタイムが用意されています。
Azure統合ランタイム: Azure統合ランタイムは、AzureまたはAzure以外のデータ ソースをスキャンするために使用できるフル マネージドのエラスティック コンピューティングです。 Azure IR では、パブリックにアクセス可能なエンドポイントを使用したデータ ストアとコンピューティング サービスへの接続がサポートされます。 これは、開始するために何も作成する必要のない既定の統合ランタイムです。
マネージド Virtual Network統合ランタイム: Purview Managed Virtual Networkに存在するマネージド Virtual Network統合ランタイムを作成できます。 プライベート エンドポイントを使用して、サポートされているデータ ソースに安全に接続してスキャンできます。 詳細については、「マネージド Virtual Networkとマネージド プライベート エンドポイント」を参照してください。
セルフホステッド統合ランタイム: セルフホステッド統合ランタイムを使用して、オンプレミス ネットワークまたは仮想ネットワーク内のデータ ソースをスキャンできます。 オンプレミスのマシンまたはプライベート ネットワーク内の仮想マシンにインストールできます。 詳細については、「 セルフホステッド統合ランタイムの作成と管理」を参照してください。
Kubernetes でサポートされているセルフホステッド統合ランタイム: この統合ランタイムは Kubernetes クラスターでホストされており、オンプレミス ネットワークまたは仮想ネットワーク内のデータ ソースをスキャンするために使用できます。 Kubernetes のサポートにより、全体的なパフォーマンスが向上し、統合ランタイムがジョブでスケーリングできるようになります。 詳細については、 Kubernetes でサポートされているセルフホステッド統合ランタイムの作成と管理に関するページを参照してください。
AWS 統合ランタイム: AWS 統合ランタイムは、AWS の Microsoft Purview によってホストされるフル マネージドでエラスティックな計算です。 これは、S3、RDS などの Amazon データ ソースをスキャンするときに適用されます。
適切な統合ランタイムを選択する
ニーズに適した統合ランタイムを選択します。 既存のアーキテクチャとデータ統合の要件を検討してください。 また、成長するビジネス ニーズと将来のワークロードの増加を満たす方法についても考えます。
次の考慮事項は、決定を下すのに役立ちます。
スキャンするデータ ソースの種類
スキャンする データ ソースでサポートされている IR の種類については、「サポートされているデータ ソース」セクションを参照してください。
データ ソースのネットワーク アクセス制御とは
さまざまなデータ ソースには、インターネット経由のランダム アクセスから保護するためのネットワーク ファイアウォール設定が異なります。 これらの設定は、オンプレミス、クラウド、SaaS データ ストアに適用されます。 次の表に、一般的なファイアウォール オプションの一覧を示します。 シナリオに応じて、サポートされている IR の種類を選択します。
データ ソース ファイアウォール Azure IR マネージド Virtual Network IR Shir Kubernetes でサポートされている SHIR パブリック アクセスを許可する ✓ ✓ ✓ ✓ サービスまたは信頼されたサービスAzure許可する ✓ ✓ ✓ ✓ 特定のAzure仮想ネットワークからのアクセスを許可する ✓ (マネージド プライベート エンドポイントのサポートあり) ✓ ✓ 特定の IP/IP 範囲を許可する ✓ ✓ その他のオンプレミスまたはプライベート ネットワーク アクセス ✓ ✓ Microsoft Purview のファイアウォール設定は何ですか?
Purview には、さまざまなネットワーク ファイアウォール オプションが用意されています。 詳細については、「 Microsoft Purview ファイアウォールの構成」を参照してください。 シナリオに応じて、サポートされている IR の種類を選択します。
Purview ファイアウォール Azure IR マネージド Virtual Network IR Shir Kubernetes でサポートされている SHIR すべてのネットワークから有効 ✓ ✓ ✓ ✓ すべてのネットワークから無効 ✓ (マネージド プライベート エンドポイントが必要) ✓ (ネットワークからプライベート エンドポイントを作成する必要があります) ✓ (ネットワークからプライベート エンドポイントを作成する必要があります) データ転送中に必要なセキュリティレベルは何ですか?
統合ランタイムの場所は、バックエンド コンピューティングの場所とスキャン操作を実行する場所を定義します。 データ所在地の考慮事項:
Azure IR を使用すると、Purview はデータ ソースの場所を自動的に検出し、そのリージョンの IR を使用します。 Purview がリージョンを検出できない場合は、Purview アカウントのリージョンが使用されます。
マネージド Virtual Network IR を使用すると、マネージド仮想ネットワーク用に構成したリージョンで実行されます。
SHIR を使用する場合は、オンプレミスまたはAzure仮想マシン内の場所を完全に決定できます。
たとえば、データ転送中の中間者攻撃から保護するには、プライベート エンドポイントとプライベート リンクを使用してデータのセキュリティを確保します。
マネージド Virtual Network IR を使用する場合は、データ ストアにマネージド プライベート エンドポイントを作成できます。 Purview サービスは、マネージド仮想ネットワーク内のプライベート エンドポイントを維持します。
仮想ネットワークにプライベート エンドポイントを作成することもできます。また、SHIR はそれらを使用してデータ ストアにアクセスできます。
どのレベルのメンテナンスを提供できますか?
インフラストラクチャ、サーバー、機器の保守は、企業の IT 部門の重要なタスクの 1 つです。 通常、多くの時間と労力がかかります。
- Azure IR とマネージド Virtual Network IR を使用する場合は、更新プログラム、パッチ、バージョンなどのメンテナンスについて心配する必要はありません。 Purview サービスは、すべてのメンテナンス作業を処理します。
- SHIR はマシンにインストールされ、Kubernetes でサポートされている SHIR は Kubernetes クラスター上にあるため、メンテナンスを管理する必要があります。
- SHIR は自動更新をサポートし、更新がある場合は常に最新バージョンを自動的に取得します。 詳細については、 セルフホステッド統合ランタイムの自動更新と有効期限に関するページを参照してください。
- 現在、 Kubernetes でサポートされているセルフホステッド統合ランタイム では、手動更新のみがサポートされています。
パフォーマンスとスケーラビリティ
必要に応じて、フル マネージドおよび自動スケーリングされた Azure IR、マネージド Virtual Network IR、または Kubernetes でサポートされるセルフホステッド統合ランタイムを使用します。 弾力性を使用することで、特に大規模なデータ システムをスキャンする場合に、パフォーマンスとスケーラビリティを向上させることができます。
マネージド仮想ネットワーク統合ランタイムの休止状態
統合ランタイムが非アクティブ (統合ランタイムで 90 日を超えるスキャンがない) 場合、マネージド Virtual Network Integration Runtimeは自動的に休止状態になります。 統合ランタイムを選択すると、その状態は休止状態として表示 されます 。
この変更の意味
休止状態の統合ランタイムでテスト接続を実行すると、テスト接続は失敗します。 15 分後にテスト接続を試すメッセージが表示されます。 この時点で、マネージド Virtual Networkは通常の状態に戻ります。 その後、テスト接続とスキャンを正常に実行できます。
休止状態のIntegration Runtimeから最初にテスト接続を実行せずに、[スキャンを今すぐ実行] または [スキャンの編集] オプションを使用してスキャンを直接実行した場合、または API を使用してスキャンを実行すると、このスキャンに最大 15 分かかるというメッセージが表示されます。 この余分な時間は、休止状態のIntegration Runtimeがスリープ解除され、スキャン プロセスが開始されます。 スキャン状態は、通常のスキャンの場合に表示されるキュー状態ではなく、Queued_Wakingアップ IR として表示されます。 最初のスキャンの後、次のすべてのスキャンを正常に実行できます。
サポートされているデータ ソース
次の表は、Purview スキャンでサポートされるすべてのデータ ソースと、サポートされている統合ランタイムの種類を示しています。
| カテゴリ | サポートされているデータ ストア | Azure IR/AWS IR | マネージド Virtual Network IR | Shir | Kubernetes SHIR |
|---|---|---|---|---|---|
| Azure | 複数のソース | ✓ | |||
| Azure Blob ストレージ | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure Cosmos DB (NoSQL 用 API) | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure Data Explorer | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| Azure Data Lake Storage Gen1 | ✓ | ✓ (v2 のみ) | ✓ | ||
| Azure Data Lake Storage Gen2 | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure Database for MySQL | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure Database for PostgreSQL | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Databricks Hive メタストアのAzure | ✓ | ✓ | |||
| Azure Databricks Unity Catalog | ✓ | ✓ (マネージド プライベート エンドポイントを含む v2 のみ) | ✓ | ||
| Azure 専用 SQL プール (旧称 SQL DW) | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure Files | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure SQL データベース | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure SQL Managed Instance | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Azure Synapse Analytics (ワークスペース) | ✓ | ✓ (マネージド プライベート エンドポイントを含む) | ✓ | ✓ | |
| Database | Amazon RDS | ✓ | ✓ | ||
| Amazon Redshift | ✓ | ✓ | |||
| Cassandra | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| Db2 | ✓ | ✓ | |||
| Google BigQuery | ✓ | ✓ | |||
| Hive メタストア データベース | ✓ | ✓ | |||
| MongoDB | ✓ | ✓ | |||
| MySQL | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| Oracle | ✓ | ||||
| PostgreSQL | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| SAP ビジネス ウェアハウス | ✓ | ✓ | |||
| SAP HANA | ✓ | ✓ | |||
| Snowflake | ✓ | ✓ (マネージド プライベート エンドポイントを含む v2 のみ) | ✓ | ||
| SQL Server | ✓ | ✓ | |||
| Azure-Arc のSQL Server | ✓ | ✓ | |||
| Teradata | ✓ | ||||
| File | Amazon S3 | ✓ | |||
| HDFS | ✓ | ✓ | |||
| サービスとアプリ | Dataverse | ✓ | ✓ (v2 のみ) | ✓ | |
| Erwin | ✓ | ||||
| Looker | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| Fabric | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| Power BI | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| Qlik Sense | ✓ | ✓ (v2 のみ) | ✓ | ||
| Salesforce | ✓ | ✓ (v2 のみ) | ✓ | ✓ | |
| SAP ECC | ✓ | ✓ | |||
| SAP S/4HANA | ✓ | ✓ | |||
| Tableau | ✓ | ✓ (v2 のみ) | ✓ |