Étiquetage des images et des documents texte

Une fois que votre administrateur de projet a créé un projet d’étiquetage des données d’image Azure Machine Learning ou un projet d’étiquetage des données de texteAzure Machine Learning, vous pouvez utiliser l’outil d’étiquetage pour préparer rapidement les données pour un projet d'apprentissage automatique. Cet article aborde les points suivants :

  • Comment accéder à vos projets d’étiquetage
  • Outils d’étiquetage
  • Comment utiliser les outils pour des tâches d’étiquetage spécifiques

Prérequis

  • Un compte Microsoft ou un compte Microsoft Entra pour l’organisation et le projet.
  • Un accès de niveau contributeur à l'espace de travail qui contient le projet d'étiquetage.

Se connecter au studio

  1. Connectez-vous à Azure Machine Learning Studio.

  2. Sélectionnez l’abonnement et l’espace de travail qui contient le projet d’étiquetage. Votre administrateur de projet fournit ces informations.

  3. Vous pouvez remarquer plusieurs sections sur la gauche, selon votre niveau d'accès. Si vous le faites, sélectionnez Étiquetage des données sur le côté gauche pour trouver le projet.

Comprendre la tâche d’étiquetage

Dans le tableau des projets d’étiquetage des données, sélectionnez le lien Étiqueter les données associé à votre projet.

Des instructions spécifiques à votre projet sont mises à votre disposition. Ces instructions expliquent le type de données concernées, la manière dont vous devez prendre vos décisions et d'autres informations pertinentes. Lisez les informations et sélectionnez Tâches en haut de la page. Vous pouvez également sélectionner Commencer l’étiquetage au bas de la page.

Sélection d’une étiquette

Dans toutes les tâches d’étiquetage des données, choisissez une balise ou des balises appropriées à partir d’un ensemble spécifié par l’administrateur du projet. Utilisez les touches de numéro de clavier pour sélectionner les neuf premières balises.

Machine Learning assisté

Le processus d'étiquetage peut déclencher des algorithmes d'apprentissage automatique. Si ces algorithmes sont activés pour votre projet, vous pouvez voir :

  • Images

    • Une fois que vous avez étiqueté certaines données, vous remarquerez peut-être des tâches regroupées en haut de votre écran, à côté du nom du projet. Les images sont regroupées pour présenter des images similaires sur la même page. Si c'est le cas, basculez vers l'une des vues d'images regroupées pour tirer parti de leur regroupement.

    • Par la suite, vous pourrez remarquer des Tâches préétiquetées à côté du nom du projet. Les éléments s’affichent avec une suggestion d’étiquette produite par un modèle de classification Machine Learning. Aucun modèle Machine Learning n’est fiable à 100 %. Bien que le système utilise uniquement les données pour lesquelles le modèle a confiance, ces valeurs de données peuvent toujours avoir des pré-étiquettes incorrectes. Lorsque vous voyez des étiquettes, corrigez toute étiquette incorrecte avant de soumettre la page.

    • Pour les modèles d'identification d'objets, vous pouvez remarquer des cadres de délimitation (bounding boxes) et des étiquettes déjà présents. Corrigez toutes les erreurs qu'elles comportent avant d’envoyer la page.

    • Pour les modèles de segmentation, vous pouvez voir des polygones et des étiquettes déjà présents. Corrigez toutes les erreurs qu'elles comportent avant d’envoyer la page.

  • Détails

    • Par la suite, vous pourrez remarquer des Tâches préétiquetées à côté du nom du projet. Les éléments s’affichent avec une suggestion d’étiquette produite par un modèle de classification Machine Learning. Aucun modèle Machine Learning n’est fiable à 100 %. Bien que le système utilise uniquement les données pour lesquelles le modèle a confiance, ces valeurs de données peuvent toujours avoir des pré-étiquettes incorrectes. Si c'est le cas, corrigez les étiquettes erronées avant d'envoyer la page.

Au début d'un projet d'étiquetage, le modèle de machine learning peut n'avoir qu'une précision suffisante pour pré-étiqueter un petit sous-ensemble d'images. Une fois que vous étiquetez ces images, le projet d’étiquetage revient à l’étiquetage manuel pour collecter plus de données pour le prochain cycle d’entraînement du modèle. Avec le temps, le modèle gagne en confiance sur une proportion plus élevée d'images. Plus tard dans le projet, ce niveau de confiance entraîne davantage de tâches préétiquetées.

Lorsqu’il n’y a plus de tâches pré-étiquetées, le processus de confirmation ou de correction de l’étiquette s’arrête et retourne au balisage manuel des éléments.

Tâches liées aux images

Pour les tâches de classification d’images, vous pouvez choisir d’afficher plusieurs images en même temps. Pour sélectionner la mise en page, utilisez les icônes au-dessus de la zone d'image.

Pour sélectionner toutes les images affichées en même temps, utilisez Sélectionner tout. Pour sélectionner des images individuelles, utilisez le bouton de sélection circulaire situé en haut à droite de l’image. Pour appliquer une balise, vous devez sélectionner au moins une image. Si vous sélectionnez plusieurs images, toutes les étiquettes que vous sélectionnez s’appliquent à l’ensemble des images sélectionnées.

Par exemple, vous pouvez choisir une disposition à deux par deux et appliquer la balise « Mammifère » aux images ours et orca, comme illustré dans la capture d’écran suivante :

Capture d'écran montrant la sélection de plusieurs images.

Cette capture d’écran montre plusieurs dispositions et sélections d’images. L’image du requin est déjà étiquetée comme « poisson cartilaginous », et l’iguane n’a pas encore de balise.

Important

Ne changez de mise en page que lorsque vous avez une nouvelle page de données non étiquetées. Le changement de mise en page efface le travail d’étiquetage en cours de la page.

Lorsque vous balisez toutes les images de la page, Azure active le bouton Envoyer . Sélectionnez Envoyer pour enregistrer votre travail.

Une fois que vous avez envoyé les étiquettes relatives aux données disponibles, Azure actualise la page en affichant un nouvel ensemble d’images provenant de la file d’attente de travail.

Tâches liées aux images médicales

Important

La possibilité d’étiqueter DICOM ou des types d’images similaires n’est pas prévue ou mise à la disposition d’un appareil médical, d’un support clinique, d’un outil de diagnostic ou d’une autre technologie destinée à être utilisée dans le diagnostic, le traitement, l’atténuation, le traitement ou la prévention de la maladie ou d’autres conditions. Microsoft n’accorde aucune licence ni droit d’utiliser cette fonctionnalité à de telles fins. Cette capacité n’est pas conçue ou destinée à être mise en œuvre ou déployée comme substitut aux conseils médicaux professionnels ou à l’opinion médicale, au diagnostic, au traitement ou au jugement clinique d’un professionnel de la santé et ne doit pas être utilisée comme tel. Le client est seul responsable de l’utilisation de l’étiquetage des données pour des images DICOM ou de types similaires.

Les projets d’images prennent en charge le format d’image DICOM pour les images de fichiers à rayons X, comme illustré dans la capture d’écran suivante :

Capture d'écran montrant une image DICOM de radiographie à étiqueter.

Pendant que vous étiquetez les images médicales à l’aide des mêmes outils que les autres images, vous pouvez utiliser un autre outil pour les images DICOM, comme illustré dans la capture d’écran suivante :

Capture d'écran montrant l'outil fenêtre et niveau pour les images DICOM.

Sélectionnez l’outil Fenêtre et niveau pour changer l’intensité de l’image. Cet outil est disponible uniquement pour les images DICOM.

Étiqueter des images pour une classification multiclasse

Attribuez une seule étiquette à l’image entière pour un type de projet « Classification d’images multi-classes ». Pour passer en revue les instructions à tout moment, accédez à la page Instructions, puis sélectionnez Afficher les instructions détaillées.

Si vous vous rendez compte que vous avez commis une erreur après avoir affecté une étiquette à une image, vous pouvez la corriger. Sélectionnez le « X » sur l'étiquette affichée sous l'image, pour effacer l'étiquette. Vous pouvez également sélectionner l’image et choisir une autre classe. La nouvelle valeur sélectionnée remplace l’étiquette précédemment appliquée.

Étiqueter des images pour une classification multiétiquette

Si votre projet est de type « Classification d’images multi-étiquette », appliquez une ou plusieurs balises à une image. Pour voir les instructions spécifiques au projet, sélectionnez Instructions, puis accédez à Afficher les instructions détaillées.

Sélectionnez l’image que vous voulez étiqueter, puis sélectionnez l’étiquette. L’étiquette est appliquée à toutes les images sélectionnées, puis les images sont désélectionnées. Pour appliquer d’autres balises aux images, vous devez les resélectionner. Cette animation montre l’étiquetage multi-étiquette :

Animation montrant le balisage à plusieurs étiquettes.

L'animation montre que

  1. Sélectionnez tout utilisé pour appliquer la balise « Ocean ».
  2. Une seule image est sélectionnée et étiquetée « Closeup ».
  3. Trois images sont sélectionnées et étiquetées « Angle large ».

Pour corriger une erreur, sélectionnez le « X » afin d’effacer une étiquette individuelle, ou sélectionnez les images nécessaires, puis l’étiquette, ce qui permet d’effacer l’étiquette de toutes les images sélectionnées. Ce scénario est illustré ici. En sélectionnant « Land » (Terre), vous effacez cette étiquette des deux images sélectionnées. Cette capture d'écran illustre le scénario :

Capture d'écran montrant la suppression des étiquettes de plusieurs images sélectionnées.

Azure active uniquement le bouton Envoyer après avoir appliqué au moins une balise à chaque image. Sélectionnez Envoyer pour enregistrer votre travail.

Étiqueter des images et spécifier des cadres englobants pour la détection d’objet

Si votre projet est de type « Identification d'objets (cadres englobants) », vous devez spécifier un ou plusieurs cadres englobants dans l'image, puis appliquer une étiquette à chaque cadre. Les images peuvent avoir plusieurs cadres englobants, chacun associé à une seule étiquette. Utilisez Afficher les instructions détaillées pour déterminer si votre projet utilise plusieurs cadres englobants.

  1. Sélectionnez une étiquette pour le cadre englobant que vous prévoyez de créer.

  2. Sélectionnez « R », ou sélectionnez l’outil boîte rectangulaire, comme illustré dans la capture d’écran suivante :

    Capture d'écran montrant la sélection de l'outil de boîte rectangulaire.

  3. Pour créer un cadre englobant approximatif, sélectionnez votre cible, puis faites glisser le curseur en diagonale. Faites glisser les bords ou les coins pour ajuster le cadre englobant, comme illustré dans la capture d'écran suivante :

    Capture d'écran montrant la création d'un cadre englobant.

Pour supprimer un cadre englobant, sélectionnez la cible en forme de X qui apparaît à côté du cadre après sa création.

Vous ne pouvez pas changer l’étiquette d’un cadre englobant. Pour corriger une erreur d'affectation d'étiquette, supprimez le cadre englobant et créez-en un nouveau avec la bonne étiquette.

Par défaut, vous pouvez modifier les cadres englobants existants. L’outil « L » ou Verrouiller/déverrouiller des régions, permet de basculer ce comportement, comme le montre la capture d’écran suivante.

Capture d'écran montrant la sélection de l'outil de verrouillage/déverrouillage des régions.

Si vous verrouillez des régions, vous ne pouvez modifier que la forme ou l'emplacement d'un nouveau cadre englobant.

L'outil de manipulation de régions consiste en quatre flèches qui commencent du centre et pointent vers l'extérieur vers le haut, le bas, la droite et la gauche, comme illustré dans la capture d'écran suivante :

Capture d'écran montrant la sélection de l'outil de manipulation des régions.

Utilisez l'outil Manipulation des régions ou « M » pour ajuster un cadre englobant existant. Pour ajuster la forme, faites glisser ses bords ou ses angles. Cliquez à l’intérieur si vous voulez faire glisser l’ensemble du cadre englobant. Si vous ne pouvez pas modifier une zone, c’est que vous avez probablement inversé le comportement de l’outil Verrouiller/déverrouiller des zones.

L'outil Cadre basé sur un modèle crée plusieurs cadres englobants de la même taille, comme illustré dans la capture d'écran suivante :

Capture d'écran montrant la sélection de l'outil Cadre basé sur un modèle.

Utilisez l'outil Cadre basé sur un modèle, ou « T », pour créer plusieurs cadres englobants de même taille. Si l’image ne contient pas de cadre englobant et si vous activez les cadres basés sur un modèle, l’outil génère des cadres de 50 x 50 pixels. Si vous créez un cadre englobant, puis que vous activez les cadres basés sur un modèle, les nouveaux cadres englobants ont la taille du dernier cadre créé. Vous pouvez redimensionner les cadres basés sur un modèle après leur placement. Le redimensionnement d’un cadre basé sur un modèle entraîne uniquement le redimensionnement de ce cadre.

Pour supprimer toutes les zones englobantes de l’image actuelle, sélectionnez l’outil Supprimer toutes les régions , comme illustré dans la capture d’écran suivante :

Capture d'écran montrant la sélection de l'outil Supprimer toutes les régions.

Après avoir créé les boîtes englobantes d’une image, sélectionnez Envoyer pour enregistrer votre travail, sinon votre travail en cours ne sera pas enregistré.

Étiqueter des images et spécifier des polygones pour la segmentation des images

Si votre projet est de type « Segmentation d’instance (polygone) », spécifiez un ou plusieurs polygones dans l’image et appliquez une étiquette à chacun de ces polygones. Les images peuvent avoir plusieurs polygones englobants, chacun étant associé à une seule étiquette. Utilisez Afficher les instructions détaillées pour déterminer si votre projet utilise des polygones englobants multiples.

  1. Sélectionnez une balise pour le polygone que vous envisagez de créer.
  2. Sélectionnez « P » ou sélectionnez l'outil Dessiner une région de polygone comme illustré dans cette capture d'écran :

Capture d'écran montrant la sélection de l'outil Dessiner une région de polygone.

  1. Sélectionnez chaque point du polygone. Lorsque vous terminez la forme, sélectionnez-la deux fois pour finaliser la création, comme illustré dans cette animation :

    Créez des polygones pour le chat et le chien.

Pour supprimer un polygone, sélectionnez la cible en forme de X qui s’affiche à côté du polygone après sa création.

Pour modifier l’étiquette d’un polygone, sélectionnez l’outil Déplacer les régions, sélectionnez le polygone, puis sélectionnez l’étiquette correcte.

Vous pouvez modifier les polygones existants. L'outil Verrouiller/déverrouiller les régions, ou la touche « L », active ou désactive ce comportement, comme illustré dans cette capture d'écran :

Capture d'écran montrant la sélection de l'outil de verrouillage/déverrouillage des régions.

Si les régions sont verrouillées, vous pourrez uniquement changer la forme ou l’emplacement des nouveaux polygones.

Utilisez l'outil Ajouter ou supprimer des points de polygone, ou la touche « U », pour ajuster un polygone existant, comme illustré dans cette capture d'écran :

Capture d'écran montrant la sélection de l'outil de verrouillage/déverrouillage des régions.

Sélectionnez le polygone pour ajouter ou supprimer un point. Si vous ne pouvez pas modifier une zone, c’est que vous avez probablement inversé le comportement de l’outil Verrouiller/déverrouiller des zones.

Pour supprimer toutes les zones englobantes de l’image actuelle, sélectionnez l’outil Supprimer toutes les régions , comme illustré dans la capture d’écran suivante :

Capture d'écran montrant la suppression de toutes les régions.

Après avoir créé les polygones d’une image, sélectionnez Envoyer pour enregistrer votre travail, ou votre travail en cours n’est pas enregistré.

Étiqueter des images et dessiner des masques pour la segmentation sémantique

Si votre projet est de type « Segmentation sémantique (préversion) », utilisez le pinceau pour peindre un masque sur la zone que vous souhaitez étiqueter.

  1. Sélectionnez une balise pour la zone sur laquelle vous souhaitez peindre.

  2. Sélectionnez l’outil paintbrush , comme illustré dans la capture d’écran suivante :

    Capture d'écran montrant la sélection de l'outil pinceau.

  3. Sélectionnez l’outil de taille pour choisir une taille pour votre pinceau, comme illustré dans la capture d’écran suivante :

    Capture d'écran montrant la sélection de la taille du pinceau.

  4. Peignez sur la zone que vous souhaitez étiqueter. La couleur correspondant à votre balise est appliquée à la zone sur laquelle vous peindrez.

    Capture d'écran de la zone peinte pour les visages de chat et de chien en segmentation sémantique.

Pour supprimer des parties de la zone, sélectionnez l'outil Gomme.

Pour modifier l'étiquette d'une zone, sélectionnez la nouvelle étiquette et repeignez la zone.

Vous pouvez également utiliser l'outil Polygone pour spécifier une région.

Après avoir créé les zones d’une image, sélectionnez Envoyer pour enregistrer votre travail. Si vous ne sélectionnez pas Envoyer, votre travail en cours n’est pas enregistré. Si vous avez utilisé l'outil Polygone, tous les polygones sont convertis en masque lors de la soumission.

Texte d'étiquette

Lorsque vous étiquetez du texte, utilisez la barre d'outils pour effectuer les opérations suivantes :

  • Augmentez ou diminuez la taille du texte.
  • Modifiez la police.
  • Ignorez l’étiquetage de cet élément et passez à l’élément suivant.

Si vous vous rendez compte que vous avez affecté la mauvaise étiquette, vous pouvez la corriger. Sélectionnez le « X » sur l'étiquette qui s'affiche sous le texte pour effacer l'étiquette.

Il existe trois types de projets texte :

Type de projet Descriptif
Classification multiclasse Attribuez une seule étiquette à la totalité de l’entrée de texte. Vous ne pouvez sélectionner qu’une seule étiquette par élément. Sélectionnez une étiquette, puis sélectionnez Envoyer pour passer à l’entrée suivante.
Classification multiétiquette Attribuez une ou plusieurs étiquettes à chaque entrée de texte. Vous pouvez sélectionner plusieurs étiquettes par élément. Sélectionnez toutes les étiquettes applicables, puis sélectionnez Envoyer pour passer à l’entrée suivante.
Reconnaissance d’entité nommée Étiquetez différents mots ou expressions dans chaque entrée de texte. Voir les instructions dans la section suivante.

Pour voir les instructions spécifiques au projet, sélectionnez Instructions, puis accédez à Afficher les instructions détaillées.

Étiqueter des mots et expressions

Si votre projet est configuré pour la reconnaissance d’entité nommée, balisez des mots ou des expressions différents dans chaque élément de texte. Pour étiqueter du texte :

  1. Sélectionnez l’étiquette ou tapez le numéro correspondant à l’étiquette appropriée.
  2. Double-cliquez sur un mot ou utilisez la souris pour en sélectionner plusieurs.

Capture d’écran : Reconnaissance d’entité nommée.

Pour modifier une étiquette, vous pouvez :

  • Supprimer l’étiquette, puis recommencer.
  • Modifier la valeur d'une partie ou de la totalité d'une étiquette spécifique dans votre élément actif :
    • Sélectionnez l’étiquette elle-même. Cela a pour effet de sélectionner toutes les instances de cette étiquette.
    • Pour désélectionner les instances que vous souhaitez conserver, sélectionnez à nouveau les instances de cette étiquette.
    • Enfin, sélectionnez une nouvelle étiquette pour modifier toutes les étiquettes qui sont toujours sélectionnées.

Après avoir baliser tous les éléments d’une entrée, sélectionnez Envoyer pour passer à l’entrée suivante.

Terminer

Quand vous envoyez une page de données marquées, Azure vous affecte de nouvelles données non étiquetées en provenance d’une file d’attente de travail. S’il ne reste plus de données non étiquetées, un nouveau message l’indique, ainsi qu’un lien vers la page d’accueil du portail.

Lorsque vous avez terminé l'étiquetage, sélectionnez votre image dans un cercle en haut à droite du studio, puis sélectionnez Déconnexion. Si vous ne vous déconnectez pas, Azure vous déconnecte automatiquement et attribue vos données à un autre annotateur.

Étapes suivantes