Créer des projets personnalisés Document Intelligence Studio

Ce contenu s’applique à :checkmarkv4.0 (GA) | Versions antérieures :blue-checkmarkv3.1 (GA)red-checkmarkv3.0 (mise hors service)

Azure Document Intelligence dans Foundry Tools Studio est un outil en ligne que vous pouvez utiliser pour explorer visuellement, comprendre et intégrer des fonctionnalités de Document Intelligence dans vos applications. Ce guide de démarrage rapide vise à vous montrer comment configurer un projet personnalisé dans Document Intelligence Studio.

Conditions préalables

Pour plus d’informations sur l’installation de l’abonnement, des ressources et de l’authentification, consultez Prise en main de Document Intelligence Studio.

Conditions préalables pour les nouveaux utilisateurs

En plus d’un compte Azure et de la ressource Document Intelligence ou Microsoft Foundry, vous avez besoin d’un conteneur Stockage Blob Azure et d’attributions de rôles Azure.

conteneur de stockage Blob Azure

Vous avez besoin d’un compte de performances standard Stockage Blob Azure. Vous pouvez créer des conteneurs pour stocker et organiser vos documents de formation au sein de votre compte de stockage. Si vous ne savez pas comment créer un compte de stockage Azure avec un conteneur, suivez ces guides de démarrage rapide :

  • Créez un compte de stockage : lorsque vous créez votre compte de stockage, dans le champ Performances des détails de >, sélectionnezPerformancesstandard.
  • Créez un conteneur : lorsque vous créez votre conteneur, dans le volet Nouveau conteneur , définissez le champ de niveau d’accès public sur Conteneur (accès en lecture anonyme pour les conteneurs et les objets blob).

Azure attributions de rôles

Pour les projets personnalisés, les attributions de rôles suivantes sont requises pour différents scénarios :

  • Élémentaire

    • Cognitive Services User : vous avez besoin de ce rôle pour la ressource Document Intelligence ou Microsoft Foundry pour entraîner le modèle personnalisé ou effectuer une analyse avec des modèles entraînés.
    • Contributeur de données Blob : vous avez besoin de ce rôle pour le compte de stockage afin de créer un projet et étiqueter les données.
  • Avancé

    • Contributeur de compte de stockage : vous avez besoin de ce rôle pour que le compte de stockage configure les paramètres de partage de ressources cross-origin (CORS). (Cette action est un effort unique si le même compte de stockage est réutilisé.)
    • Contributeur : vous avez besoin de ce rôle pour créer des groupes de ressources et des ressources.

    Note

    Si l’authentification locale (basée sur des clés) est désactivée pour votre ressource de service Document Intelligence et votre compte de stockage, veillez à obtenir des rôles Contributeur aux données blob et utilisateur Cognitive Services, respectivement, afin que vous disposiez des autorisations suffisantes pour utiliser Document Intelligence Studio. Les rôles de Contributeur du compte de stockage et de Contributeur vous permettent de répertorier les clés, mais ils ne vous donnent pas l’autorisation d’utiliser les ressources lorsque l’accès aux clés est désactivé.

Configurer CORS

Partage des ressources d’origine croisée doit être configuré sur votre compte de stockage Azure pour qu’il soit accessible à partir de Document Intelligence Studio. Pour configurer CORS dans le portail Azure, vous devez accéder à l’onglet CORS de votre compte de stockage.

  1. Sélectionnez l’onglet CORS du compte de stockage.

    Screenshot qui affiche le menu du paramètre CORS dans le Azure portal.

  2. Commencez par créer une entrée CORS sous l’onglet Service Blob .

  3. Définissez les origines autorisées sur https://documentintelligence.ai.azure.com.

    Capture d’écran montrant la configuration CORS pour un compte de stockage.

    Vous pouvez utiliser le caractère * générique au lieu d’un domaine spécifié pour autoriser tous les domaines d’origine à effectuer des requêtes via CORS.

  4. Sélectionnez toutes les huit options disponibles pour les méthodes autorisées.

  5. Approuvez tous les en-têtes autorisés et les en-têtes Exposés en entrant un astérisque (*) dans chaque champ.

  6. Définissez l’âge maximal sur 120 secondes ou toute valeur acceptable.

  7. Pour enregistrer les modifications, sélectionnez Enregistrer en haut de la page.

CORS doit maintenant être configuré pour utiliser le compte de stockage à partir de Document Intelligence Studio.

Ensemble d'exemples de documents

  1. Connectez-vous au portail Azure. Accédez à votre compte de stockage et sélectionnezConteneurs>.

    Screenshot qui affiche le menu stockage des données dans le portail Azure.

  2. Sélectionnez un conteneur dans la liste.

  3. Dans le menu en haut de la page, sélectionnez Charger.

    Screenshot qui affiche le bouton Charger le conteneur dans le Azure portal.

  4. Dans le volet Téléverser des objets blob, sélectionnez vos fichiers à téléverser.

    Capture d'écran affichant le volet Charger des objets blob dans le portail Azure.

Note

Par défaut, Document Intelligence Studio utilise des documents situés à la racine de votre conteneur. Vous pouvez utiliser des données organisées dans des dossiers en spécifiant le chemin d’accès au dossier dans les étapes de création d’un projet de formulaire personnalisé. Pour plus d’informations, consultez Organiser vos données dans les sous-dossiers.

Utiliser les fonctionnalités de Document Intelligence Studio

Étiquette automatique des documents avec des modèles prédéfinis ou l’un de vos propres modèles

Sur la page d’étiquetage du modèle d’extraction personnalisé, vous pouvez désormais étiqueter automatiquement vos documents à l’aide de l’un des modèles prédéfinis du service intelligent de documents ou de vos modèles entraînés.

Capture d’écran animée montrant l’étiquetage automatique.

Pour certains documents, des étiquettes en double peuvent apparaître après l'exécution d’autolabel. Veillez à modifier les étiquettes afin qu’il n’y ait pas d’étiquettes en double sur la page d’étiquetage par la suite.

Capture d’écran montrant l’avertissement d’étiquette en double après l’étiquetage automatique.

Tables d’étiquetage automatique

Dans la page d’étiquetage du modèle d’extraction personnalisé, vous pouvez désormais étiqueter automatiquement les tables du document sans avoir à étiqueter les tables manuellement.

Capture d’écran animée montrant l’étiquetage autotable.

Ajouter des fichiers de test directement à votre jeu de données d’entraînement

Après avoir entraîné un modèle d’extraction personnalisé, utilisez la page de test pour améliorer la qualité de votre modèle en chargeant des documents de test dans le jeu de données d’entraînement, si nécessaire.

Si un score de confiance faible est retourné pour certaines étiquettes, veillez à étiqueter correctement votre contenu. Si ce n’est pas le cas, ajoutez-les au jeu de données d’entraînement et ré-étiquetez-les pour améliorer la qualité du modèle.

Capture d’écran animée montrant comment ajouter des fichiers de test à un jeu de données d’entraînement.

Utiliser les options et filtres de liste de documents dans les projets personnalisés

Utilisez la page d’étiquetage du modèle d’extraction personnalisé pour parcourir facilement vos documents d’apprentissage en utilisant facilement les fonctionnalités de recherche, de filtre et de tri.

Utilisez l’affichage grille pour afficher un aperçu des documents ou utilisez l’affichage liste pour parcourir les documents plus facilement.

Capture d’écran montrant les options et les filtres d’affichage de liste de documents.

partage de projet

Partagez facilement des projets d’extraction personnalisés. Pour plus d’informations, consultez Partage de projets avec des modèles personnalisés.