AutoMLStep Classe

Crée une étape de pipeline Azure ML qui encapsule une exécution ml automatisée.

Pour obtenir un exemple d’utilisation d’AutoMLStep, consultez le notebook https://aka.ms/pl-automl.

Initialisez un AutoMLStep.

Constructeur

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Paramètres

Nom Description
name
Obligatoire
str

Nom de l’étape.

automl_config
Obligatoire

Objet AutoMLConfig qui définit la configuration de cette exécution AutoML.

inputs

Liste des liaisons de port d’entrée.

Valeur par défaut: None
outputs

Liste des liaisons de port de sortie.

Valeur par défaut: None
script_repl_params

Paramètres facultatifs à remplacer dans un script, par exemple {'param1' : 'value1', 'param2' : 'value2'}.

Valeur par défaut: None
allow_reuse

Indique si l’étape doit réutiliser les résultats précédents lors de la réexécutation avec les mêmes paramètres.

La réutilisation est activée par défaut. Si le contenu de l’étape (scripts/dépendances) ainsi que les entrées et les paramètres restent inchangés, la sortie de l’exécution précédente de cette étape est réutilisée. Lors de la réutilisation de l’étape, au lieu de soumettre le travail au calcul, les résultats de l’exécution précédente sont immédiatement mis à la disposition des étapes suivantes. Si vous utilisez des jeux de données Azure Machine Learning comme entrées, la réutilisation est déterminée par la modification de la définition du jeu de données, et non par la modification des données sous-jacentes.

Valeur par défaut: True
version
str

Version à affecter à l’étape.

Valeur par défaut: None
hash_paths

OBSOLESCENT. Liste des chemins d’accès au hachage lors de la vérification des modifications apportées au contenu de l’étape du pipeline.

Par défaut, tous les fichiers sous le path paramètre sont AutoMLConfig hachés à l’exception des fichiers répertoriés dans .amlignore ou .gitignore sous path. S’il n’y a aucune modification détectée, le pipeline réutilise le contenu de l’étape à partir d’une exécution précédente.

Valeur par défaut: None
enable_default_model_output

Indique si le meilleur modèle sera ajouté ou non en tant que sortie par défaut. Cela peut être utilisé pour récupérer le meilleur modèle une fois l’exécution terminée à l’aide de la AutoMLStepRun classe. Notez que si la sortie du modèle par défaut n’est pas requise, il est recommandé de définir ce paramètre Falsesur .

Valeur par défaut: True
enable_default_metrics_output

Indique si toutes les métriques d’exécution enfant seront ajoutées en tant que sortie par défaut. Cela peut être utilisé pour récupérer les métriques d’exécution enfants une fois l’exécution terminée à l’aide de la AutoMLStepRun classe. Notez que si la sortie des métriques par défaut n’est pas requise, il est recommandé de définir ce paramètre Falsesur .

Valeur par défaut: True
name
Obligatoire
str

Nom de l’étape.

automl_config
Obligatoire

AutoMLConfig qui définit la configuration de cette exécution AutoML.

inputs
Obligatoire

Liste des liaisons de port d’entrée.

outputs
Obligatoire

Liste des liaisons de port de sortie.

script_repl_params
Obligatoire

Paramètres facultatifs à remplacer dans un script, par exemple {'param1' : 'value1', 'param2' : 'value2'}.

script_repl_params
Obligatoire

Paramètres facultatifs à remplacer dans un script.

allow_reuse
Obligatoire

Indique si l’étape doit réutiliser les résultats précédents lors de la réexécutation avec les mêmes paramètres.

La réutilisation est activée par défaut. Si le contenu de l’étape (scripts/dépendances) ainsi que les entrées et les paramètres restent inchangés, la sortie de l’exécution précédente de cette étape est réutilisée. Lors de la réutilisation de l’étape, au lieu de soumettre le travail au calcul, les résultats de l’exécution précédente sont immédiatement mis à la disposition des étapes suivantes. Si vous utilisez des jeux de données Azure Machine Learning comme entrées, la réutilisation est déterminée par la modification de la définition du jeu de données, et non par la modification des données sous-jacentes.

version
Obligatoire
str

Version à affecter à l’étape.

hash_paths
Obligatoire

OBSOLESCENT. Liste des chemins d’accès au hachage lors de la vérification des modifications apportées au contenu de l’étape du pipeline.

Par défaut, tous les fichiers sous le path paramètre sont AutoMLConfig hachés à l’exception des fichiers répertoriés dans .amlignore ou .gitignore sous path. S’il n’y a aucune modification détectée, le pipeline réutilise le contenu de l’étape à partir d’une exécution précédente.

enable_default_model_output
Obligatoire

Indique si le meilleur modèle sera ajouté ou non en tant que sortie par défaut. Cela peut être utilisé pour récupérer le meilleur modèle une fois l’exécution terminée à l’aide de la AutoMLStepRun classe. Notez que si la sortie du modèle par défaut n’est pas requise, il est recommandé de définir ce paramètre Falsesur .

enable_default_metrics_output
Obligatoire

Indique si toutes les métriques d’exécution enfant seront ajoutées en tant que sortie par défaut. Cela peut être utilisé pour récupérer les métriques d’exécution enfants une fois l’exécution terminée à l’aide de la AutoMLStepRun classe. Notez que si la sortie des métriques par défaut n’est pas requise, il est recommandé de définir ce paramètre Falsesur .

Remarques

Avec la classe AutoMLStep, vous pouvez exécuter votre workflow ML automatisé dans un pipeline Azure Machine Learning. Les pipelines offrent des avantages tels que la répétabilité, les exécutions sans assistance, le contrôle de version et le suivi, ainsi que la modularité pour votre flux de travail ML automatisé. Pour plus d’informations, consultez Présentation des pipelines Azure Machine Learning ?

Lorsque votre flux de travail ML automatisé se trouve dans un pipeline, vous pouvez planifier l’exécution du pipeline selon une planification basée sur le temps ou sur une planification basée sur les modifications. Les planifications basées sur le temps sont utiles pour les tâches courantes, telles que la surveillance de la dérive des données, tandis que les planifications basées sur les modifications sont utiles pour les modifications irrégulières ou imprévisibles, comme lorsque les données changent. Par exemple, votre planification peut interroger un magasin d’objets blob où les données sont chargées, puis réexécuter le pipeline si les données changent, puis inscrire une nouvelle version du modèle une fois l’exécution terminée. Pour plus d’informations, consultez Planifier des pipelines Machine Learning et déclencher une exécution d’un pipeline Machine Learning à partir d’une application logique.

L’exemple suivant montre comment créer un AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

L’exemple complet est disponible à partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

L’exemple suivant montre comment utiliser l’objet AutoMLStep dans un Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

L’exemple complet est disponible à partir de https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

L’exemple ci-dessus montre une étape dans le pipeline. Toutefois, lors de l’utilisation d’AutoMLStep dans un flux de travail ML automatisé réel, vous aurez au moins une étape de pipeline qui effectue la préparation des données avant autoMLStep et une autre étape de pipeline après avoir inscrit le modèle. Pour obtenir un exemple de ce type de flux de travail, consultez le bloc-notes https://aka.ms/automl-retrain-pipeline.

Pour gérer, vérifier l’état et obtenir les détails de l’exécution du pipeline, utilisez la AutoMLStepRun classe.

Pour plus d’informations sur le Machine Learning automatisé dans Azure, consultez l’article Qu’est-ce que le Machine Learning automatisé ?. Pour plus d’informations sur la configuration d’une expérience ML automatisée sans utiliser de pipeline, consultez l’article Configurer l’expérience ML automatisée en Python.

Méthodes

create_node

Créez un nœud à partir de cette étape AutoML et ajoutez-y le graphique donné.

Cette méthode n’est pas destinée à être utilisée directement. Lorsqu’un pipeline est instancié avec cette étape, Azure ML transmet automatiquement les paramètres requis par cette méthode afin que cette étape puisse être ajoutée à un graphique de pipeline qui représente le flux de travail.

create_node

Créez un nœud à partir de cette étape AutoML et ajoutez-y le graphique donné.

Cette méthode n’est pas destinée à être utilisée directement. Lorsqu’un pipeline est instancié avec cette étape, Azure ML transmet automatiquement les paramètres requis par cette méthode afin que cette étape puisse être ajoutée à un graphique de pipeline qui représente le flux de travail.

create_node(graph, default_datastore, context)

Paramètres

Nom Description
graph
Obligatoire

Objet graphique auquel ajouter le nœud.

default_datastore
Obligatoire

Magasin de données par défaut.

context
Obligatoire
<xref:azureml.pipeline.core._GraphContext>

Contexte de graphe.

Retours

Type Description

Nœud créé.

Attributs

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'