Bereitstellen und Verwenden von Claude-Modellen in Microsoft Foundry (Vorschau)

Anthropic Claude-Modelle bringen fortschrittliche Funktionen für KI-gestützte Unterhaltungen zu Microsoft Foundry, sodass Sie intelligente Anwendungen mit modernstem Sprachverständnis und -generierung erstellen können. Claude-Modelle zeichnen sich durch komplexe Gründe, Codegenerierung und multimodale Aufgaben wie Bildanalyse aus.

In diesem Artikel erfahren Sie, wie Sie:

  • Bereitstellen von Claude-Modellen in Microsoft Foundry
  • Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
  • Aufrufen der Claude Messages-API aus Python, JavaScript oder REST
  • Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.

Claude Modelle in Foundry umfassen:

Modellfamilie Modelle
Claude Mythos claude-mythos-preview 1 (Gesteuertes Forschungsvorschau)
Claude Opus claude-opus-4-7 2 (Vorschau), claude-opus-4-6 (Vorschau), claude-opus-4-5 (Vorschau), claude-opus-4-1 (Vorschau)
Claude Sonnet claude-sonnet-4-6 (Vorschau), claude-sonnet-4-5 (Vorschau)
Claude Haiku claude-haiku-4-5 (Vorschau)

1Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach Ermessen von Anthropic gewährt und wird für defensive Cybersicherheitsanwendungen priorisiert. Siehe die Claude Mythos Preview-Systemkarte für Anweisungen zur verantwortungsvollen Verwendung.

2 Folgen Sie dem Migrationshandbuch zum Migrieren von Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7.

Weitere Informationen zu den einzelnen Modellen finden Sie unter Verfügbare Claude Modelle.

Voraussetzungen

Support für Abonnementtyp und Region

Um Claude Modelle in Microsoft Foundry zu verwenden, müssen Sie über ein kostenpflichtiges Azure-Abonnement mit einem Abrechnungskonto in einem Land oder einer Region verfügen, in dem Anthropic die Modelle zum Kauf anbietet. Eine Liste allgemeiner Abonnementfehler finden Sie unter Allgemeine Fehlermeldungen und Lösungen. Die folgenden Abonnementtypen werden derzeit nicht unterstützt:

  • Unternehmenskonten in Südkorea
  • Cloud Solution Provider Abonnements
  • Azure Abonnements ohne aktive Abrechnungsmethode (z. B. Studenten-, kostenlose Test- oder Startguthabenkonten)
  • Gesponserte Abonnements, die nur Azure Credits verwenden. Hinweis: Wenn Sie über ein Konto mit einer Kreditkarte verfügen, wird die Kreditkarte anstelle von Azure Credits belastet.

Eine Liste der unterstützten Regionen finden Sie unter unterstützten geografischen Standorten. Beachten Sie, dass die "Richtlinie für unterstützte Regionen" von Anthropic in Ihrer Region für die Verfügbarkeit gelten kann. Überprüfen Sie unterstützte Regionen für Details.

Bereitstellen von Claude-Modellen

Claude-Modelle in Foundry sind für die globale Standardbereitstellung verfügbar. Um ein Claude-Modell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.

Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv zu testen.

Aufrufen der Claude Messages-API

Nachdem Sie ein Claude-Modell bereitgestellt haben, interagieren Sie damit, um Textantworten zu generieren:

  • Verwenden Sie die Anthropic SDKs und die folgenden Claude-APIs:

    • Nachrichten-API: Senden Einer strukturierten Liste von Eingabemeldungen mit Text- oder Bildinhalten. Das Modell generiert die nächste Nachricht in der Unterhaltung.
    • Api für die Tokenanzahl: Zählen Sie die Anzahl der Token in einer Nachricht.
    • Datei-API: Hochladen und Verwalten von Dateien für die Verwendung mit der Claude-API ohne erneutes Hochladen von Inhalten mit jeder Anforderung.
    • Skills API: Erstellen benutzerdefinierter Fähigkeiten für Claude AI.

Senden von Nachrichten mit Authentifizierung

Die folgenden Beispiele zeigen, wie Anforderungen mithilfe von Microsoft Entra ID oder API-Schlüsselauthentifizierung an Claude Sonnet 4.6 gesendet werden. Um mit Ihrem bereitgestellten Modell zu arbeiten, benötigen Sie Folgendes:

  • Ihre Basis-URL, die dem Formular https://<resource name>.services.ai.azure.com/anthropicentspricht.
  • Der Ziel-URI aus den Bereitstellungsdetails, der in der Form https://<resource name>.services.ai.azure.com/anthropic/v1/messages vorliegt.
  • Microsoft Entra ID für die schlüssellose Authentifizierung oder den API-Schlüssel Ihrer Implementierung für die API-Authentifizierung.
  • Der Bereitstellungsname, den Sie während der Bereitstellungserstellung ausgewählt haben. Dieser Name kann sich von der Modell-ID unterscheiden.

Hinweis

Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Mit dem Typ adaptive kann das Modell entscheiden, ob es basierend auf der Abfragekomplexität und der Leistungsstufe denken soll.

Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.

Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.

Der effort Parameter, der den Qualitäts-/Kosten-Kompromiss für Antworten steuert, unterstützt die Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt der Parameter auch den Leistungsgrad max. Verwenden Sie diesen Parameter mit oder ohne Aktivierung der Denkfunktion.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL mit Microsoft Entra ID Authentifizierung.

  1. Installieren Sie die Azure Identity-Clientbibliothek: Installieren Sie diese Bibliothek, um die DefaultAzureCredential zu verwenden. Die Autorisierung ist am einfachsten, wenn Sie DefaultAzureCredential verwenden, da dies die besten Anmeldeinformationen findet, die in ihrer Laufumgebung verwendet werden.

    pip install azure-identity
    

    Legen Sie die Werte der Client-ID, der Mandanten-ID und des geheimen Clientschlüssels der Microsoft Entra ID Anwendung als Umgebungsvariablen fest: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.

    export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
    export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
    export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
    
  2. Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher).

    pip install -U "anthropic"
    
  3. Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

    1. Erstellen Sie einen Client mit dem Anthropic SDK mit Microsoft Entra ID Authentifizierung.
    2. Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.
    from anthropic import AnthropicFoundry
    from azure.identity import DefaultAzureCredential, get_bearer_token_provider
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    
    # Create token provider for Entra ID authentication
    tokenProvider = get_bearer_token_provider(
        DefaultAzureCredential(), "https://ai.azure.com/.default"
    )
    
    # Create client with Entra ID authentication
    client = AnthropicFoundry(
        azure_ad_token_provider=tokenProvider,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

    Reference:Anthropic Client SDK, DefaultAzureCredential

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL und Ihren API-Schlüssel, um sich bei dem Dienst zu authentifizieren.

  1. Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher):

    pip install -U "anthropic"
    
  2. Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

    1. Erstellen Sie einen Client mit dem Anthropic SDK, indem Sie Ihren API-Schlüssel an die Konfiguration des SDK übergeben. Mit dieser Authentifizierungsmethode können Sie nahtlos mit dem Dienst interagieren.
    2. Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.
    from anthropic import AnthropicFoundry
    
    baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
    deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
    apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key
    
    # Create client with API key authentication
    client = AnthropicFoundry(
        api_key=apiKey,
        base_url=baseURL
    )
    
    # Send request
    message = client.messages.create(
        model=deploymentName,
        messages=[
            {"role": "user", "content": "What are 3 things to visit in Seattle?"}
        ],
        max_tokens=1048,
        temperature=1,
        thinking={"type":"adaptive"},
        output_config={"effort": "max"},
        stream=False
    )
    
    print(message.content)
    

    Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

    Reference:Anthropic Client SDK

Verfügbare Claude Modelle

Foundry unterstützt Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5 Modelle über die globale Standardbereitstellung. Diese Modelle verfügen über wichtige Funktionen:

  • Adaptives Denken: Ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.
  • Erweitertes Denken: Erweiterte Begründung für komplexe Aufgaben.
  • Bild- und Texteingabe: Starke Vision für die Analyse von Diagrammen, technischen Diagrammen, Berichten und anderen visuellen Materialien.
  • Codegenerierung: Erweiterte Codegenerierung, -analyse und -debugging.

Weitere Informationen zu den Modellfunktionen finden Sie in den Funktionen von Claude-Modellen.

Claude Mythos (Gesteuerte Forschungsvorschau)

Wichtig

Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach Ermessen von Anthropic gewährt und wird für defensive Cybersicherheitsanwendungen priorisiert. Siehe die Claude Mythos Preview-Systemkarte für Anweisungen zur verantwortungsvollen Verwendung.

Claude Mythos Preview unterstützt nur Microsoft Entra ID-Authentifizierung.

Claude Mythos Preview ist eine neue Klasse von Intelligenz, die für ehrgeizige Projekte entwickelt wurde, und das weltweit beste Modell für Cybersicherheit, autonomes Codieren und langjährige Agenten. Nur als Gated Research Preview verfügbar, wobei der Zugriff für defensive Cybersicherheits-Anwendungsfälle priorisiert ist. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K wird Claude Mythos Preview für:

  • Cybersicherheit: Das weltweit beste Modell für defensive Sicherheit. Es kann Korrekturen für echte Sicherheitsrisiken in Produktionscodebasen finden und vorschlagen und dann helfen, die Korrekturen zu beweisen.
  • Autonomes Codieren: Behandelt den vollständigen Engineering-Zyklus effektiver als jedes vorherige Modell – Untersuchung, Implementierung und Tests über große Codebasen hinweg von Ziel zu Versand.
  • Langlaufende Agenten: Setzt neue Maßstäbe für agentische Arbeit über einen langen Zeitraum. Sie kann eine einheitliche Durchführung über erweiterte, mehrstündige Aufgaben aufrechterhalten, sich anpassen, wenn sich die Bedingungen ändern, und die Arbeit mit weniger Eingriffen voranbringen.

Claude Mythos Preview unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.

Claude Opus 4.7 (Vorschau)

Tipp

Folgen Sie dem Migrationshandbuch , um Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7 zu migrieren.

Claude Opus 4.7 ist das fähigste Modell in der Claude Opus-Familie, das die Leistung über Codierung, Unternehmensworkflows und langfristige agentische Aufgaben hinweg verbessert. Mit einem Kontextfenster von 1M-Token und einer maximalen Ausgabe von 128K ist Opus 4.7 ideal für agentische Codierung, Unternehmenswissensarbeit, langlebige Multi-Tool-Workflows, hochauflösende multimodale Begründung (bis zu 2576px / 3,75MP), Finanzanalyse und Cybersicherheit. Opus 4.7 unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Aufgaben- und Leistungsniveau so viel oder so wenig wie nötig zu denken.

Claude Opus 4.6 (Vorschau)

Claude Opus 4.6 ist ein hochfähiges Modell in der Claude Opus-Familie für Codierung, Unternehmensmitarbeiter und professionelle Arbeit. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K eignet sich Opus 4.6 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung.

Claude Opus 4.5 (Vorschau)

Claude Opus 4.5 ist branchenweit führend in Codierung, Agenten, Computernutzung und Unternehmensworkflows. Mit einem Kontextfenster von 200K-Token und einer maximalen Ausgabe von 64K eignet sich Opus 4.5 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendungsaufgaben.

Claude Opus 4.1 (Vorschau)

Claude Opus 4.1 ist Branchenführer für Codierung. Es bietet eine anhaltende Leistung bei lang andauernden Aufgaben, die fokussierte Anstrengungen und Tausende von Schritten erfordern, wodurch KI-Agenten erheblich mehr lösen können.

Claude Sonnet 4.6 (Vorschau)

Claude Sonnet 4.6 liefert Spitzenintelligenz in großem Maßstab – entwickelt für Programmierung, Agenten und Unternehmensworkflows. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K ist Sonnet 4.6 ideal für Codierung, Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung geeignet.

Claude Sonnet 4.5 (Vorschau)

Warnung

1M Context Beta auf Claude Sonnet 4.5 wird nach dem 30. April 2026 eingestellt.

Ab dem 1. Mai 2026:

  • Anforderungen von mehr als 200K-Token, die den Beta-Header auf Sonnet 4.5 enthalten, lösen einen Fehler aus.
  • Anforderungen von 200K-Token oder weniger bleiben unberührt, selbst wenn der Header vorhanden ist.

Entfernen Sie zum Migrieren den context-1m-2025-08-07 Beta-Header aus Ihren Anforderungen. Für Workloads, die 1M-Kontext erfordern, migrieren Sie zu Claude Sonnet 4.6 (wobei 1M-Kontext allgemein verfügbar ist) oder zu Claude Opus 4.6 oder Claude Opus 4.7 für Workloads mit höherer Intelligenz.

Claude Sonnet 4.5 ist ein hochfähiges Modell, das für die Erstellung von realen Agenten entwickelt wurde und komplexe, langhorizonte Aufgaben verarbeitet. Es bietet eine starke Balance von Geschwindigkeit und Kosten für großvolumige Anwendungsfälle. Sonnet 4.5 bietet auch eine fortschrittliche Genauigkeit für die Computernutzung, sodass Entwickler Claude so leiten können, wie menschen es tun.

Claude Haiku 4.5 (Vorschau)

Claude Haiku 4.5 bietet nahezu Frontier-Leistung für eine breite Palette von Einsatzbereichen. Es zeichnet sich als eines der besten Programmier- und Agentenmodelle aus, mit der richtigen Geschwindigkeit und den richtigen Kosten, um kostenlose Produkte und hochskalierte Subagenten anzutreiben.

Erweiterte Merkmale und Funktionen von Claude-Modellen

Claude bei den Foundry Modellen unterstützt erweiterte Funktionen. Kernfunktionen verbessern die grundlegenden Fähigkeiten von Claude für die Verarbeitung, Analyse und Generierung von Inhalten in verschiedenen Formaten und Anwendungsfällen. Mit Tools kann Claude mit externen Systemen interagieren, Code ausführen und automatisierte Aufgaben über verschiedene Toolschnittstellen ausführen.

Einige der Kernfunktionen , die Foundry unterstützt, sind:

  • Großes Kontextfenster: Ein erweitertes Kontextfenster, das größere Dokumente und längere Unterhaltungen verarbeitet.

  • Agent-Fähigkeiten: Erweitern Sie Claudes Fähigkeiten mit Fähigkeiten.

  • Zitate: Die Antworten von Claude sollten in Quelldokumenten verankert werden.

  • Kontextbearbeitung: Verwalten Sie den Unterhaltungskontext automatisch mit konfigurierbaren Strategien.

  • Erweitertes Denken: Erweiterte Logikfunktionen für komplexe Aufgaben, die mit allen Claude-Modellen zur Verfügung stehen.

    Tipp

    Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Mit dem Typ adaptive kann das Modell entscheiden, ob es basierend auf der Abfragekomplexität und der Leistungsstufe denken soll.

    Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.

    Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.

  • Anstrengung: Möglichkeit, den Qualitäts-/Kosten-Kompromiss für Antworten zu kontrollieren.

    Tipp

    Der effort Parameter unterstützt Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt der Parameter auch den Leistungsgrad max. Verwenden Sie diesen Parameter mit oder ohne Aktivierung der Denkfunktion.

  • PDF-Unterstützung: Verarbeiten und Analysieren von Text und visuellen Inhalten aus PDF-Dokumenten.

Einige der Tools , die Foundry unterstützt, sind:

  • MCP-Connector: Stellen Sie eine direkte Verbindung mit Remote-MCP-Servern über die Nachrichten-API ohne einen separaten MCP-Client her.
  • Speicher: Speichern und Abrufen von Informationen über Unterhaltungen hinweg. Erstellen Sie im Laufe der Zeit Wissensbasen, pflegen Sie den Projektkontext und lernen Sie aus früheren Interaktionen.
  • Web-Abruf: Abrufen vollständiger Inhalte aus angegebenen Webseiten und PDF-Dokumenten für eine eingehende Analyse.

Eine vollständige Liste der unterstützten Funktionen und Tools finden Sie in der Übersicht über die Features von Claude.

Agentensupport

API-Kontingente und -Grenzwerte

Wichtig

Derzeit sind nur Enterprise- und MCA-E-Abonnements für die Claude-Modellnutzung in Foundry berechtigt.

Claude Modelle in Foundry haben die folgenden Geschwindigkeitsgrenzwerte, gemessen in Token pro Minute (TPM) und Anforderungen pro Minute (RPM):

Modell Bereitstellungstyp Standard-RPM Standard-TPM Enterprise und MCA-E RPM Enterprise- und MCA-E-TPM
claude-opus-4-7 Globaler Standard 0 0 2.000 2,000,000
claude-opus-4-6 Globaler Standard 0 0 2.000 2,000,000
claude-opus-4-5 Globaler Standard 0 0 2.000 2,000,000
claude-opus-4-1 Globaler Standard 0 0 2.000 2,000,000
claude-sonnet-4-6 Globaler Standard 0 0 2.000 2,000,000
claude-sonnet-4-5 Globaler Standard 0 0 4,000 2,000,000
claude-haiku-4-5 Globaler Standard 0 0 4,000 4.000.000

Um Ihr Kontingent über die Standardgrenzwerte hinaus zu erhöhen, senden Sie eine Anforderung über das Anforderungsformular zur Erhöhung des Kontingents.

Bewährte Methoden für Zinslimits

So optimieren Sie Ihre Nutzung und vermeiden Sie eine Begrenzung der Rate:

  • Implementieren Sie Retry-Logik: Behandeln von 429-Antworten mit exponentiellem Backoff.
  • Batchanforderungen: Kombinieren Sie nach Möglichkeit mehrere Eingabeaufforderungen.
  • Überwachen Sie die Verwendung: Verfolgen Sie Ihre Tokennutzung und Anforderungsmuster.
  • Verwenden Sie geeignete Modelle: Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.

Verantwortungsvolle KI-Überlegungen

Berücksichtigen Sie bei der Verwendung von Claude-Modellen in Gießerei die folgenden verantwortungsvollen KI-Praktiken:

Bewährte Methoden

Befolgen Sie die folgenden bewährten Methoden beim Arbeiten mit Claude-Modellen in Foundry:

Modellauswahl

Wählen Sie das entsprechende Claude-Modell basierend auf Ihren spezifischen Anforderungen aus:

  • Claude Mythos Preview: Für defensive Cybersicherheit, autonomes Codieren und langjährige Agenten.
  • Claude Opus 4.7: Am besten geeignetes Modell für Codierung, Unternehmensworkflows und langfristige agentische Aufgaben.
  • Claude Opus 4.6: Hochfähiges Modell zum Erstellen von Agenten, Codierung und Unternehmensworkflows.
  • Claude Opus 4.5: Optimale Leistung für Codierung, Agents, Computernutzung und Unternehmensworkflows.
  • Claude Opus 4.1: Komplexes Denken und Unternehmensanwendungen.
  • Claude Sonnet 4.6: Grenzintelligenz im Maßstab für Codierung, Agenten und die meisten Anwendungsfälle.
  • Claude Sonnet 4.5: Ausgewogene Leistung und Fähigkeiten, Produktionsabläufe.
  • Claude Haiku 4.5: Geschwindigkeit und Kostenoptimierung, Verarbeitung mit hohem Volumen.

Prompt-Entwicklung

  • Klare Anweisungen: Geben Sie bestimmte und detaillierte Eingabeaufforderungen an.
  • Kontextverwaltung: Verwenden Sie das verfügbare Kontextfenster effektiv.
  • Rollendefinitionen: Verwenden Sie Systemmeldungen, um die Rolle und das Verhalten des Assistenten zu definieren.
  • Strukturierte Eingabeaufforderungen: Verwenden Sie eine konsistente Formatierung, um bessere Ergebnisse zu erzielen.

Kostenoptimierung

  • Tokenverwaltung: Überwachen und Optimieren der Tokennutzung.
  • Modellauswahl: Verwenden Sie das kostengünstigste Modell für Ihren Anwendungsfall.
  • Batchverarbeitung anfordern: Kombinieren Sie nach Möglichkeit mehrere Anforderungen.

Problembehandlung

In der folgenden Tabelle sind häufige Fehler und deren Lösungen aufgeführt, die auftreten, wenn Sie mit Claude-Modellen in Foundry arbeiten:

Fehler Ursache Lösung
401 Nicht autorisiert Ungültiger oder abgelaufener API-Schlüssel oder ungültiger Entra ID Tokenbereich. Überprüfen Sie, ob der API-Schlüssel korrekt ist. Bestätigen Sie für Entra ID, dass Sie den Bereich https://ai.azure.com/.default verwenden.
403 Verboten Unzureichende Berechtigungen für die Ressource oder das Abonnement. Vergewissern Sie sich, dass Sie über die Rolle "Mitwirkender " oder "Besitzer " in der Ressourcengruppe verfügen. Stellen Sie für Entra ID sicher, dass die Rolle Cognitive Services User zugewiesen ist.
404 nicht gefunden Falsche Endpunkt-URL oder Bereitstellungsname. Vergewissern Sie sich, dass Ihre Basis-URL dem Muster https://<resource-name>.services.ai.azure.com/anthropic folgt, und der Bereitstellungsname entspricht Ihrer Konfiguration.
429 zu viele Anforderungen Das Limit für Ihre Abonnementstufe wurde überschritten. Implementieren Sie exponentielle Backoffs mit Wiederholungslogik. Erwägen Sie, die Anforderungshäufigkeit zu reduzieren oder eine Kontingenterhöhung anzufordern.
Fehler bei der Abonnementberechtigung Nicht-Enterprise- oder nicht-MCA-E-Abonnement. Claude-Modelle erfordern ein Enterprise- oder MCA-E-Abonnement. Details finden Sie unter API-Kontingente und -Grenzwerte .
Region nicht verfügbar Die Bereitstellung wurde in einer nicht unterstützten Region durchgeführt. Stellen Sie in Ost-USA2 oder Zentral-Schweden, den unterstützten Regionen für Claude-Modelle, bereit.