Bereitstellen und Verwenden von Claude-Modellen in Microsoft Foundry (Vorschau)

Anthropic Claude-Modelle bringen fortschrittliche Funktionen für KI-gestützte Unterhaltungen zu Microsoft Foundry, sodass Sie intelligente Anwendungen mit modernstem Sprachverständnis und -generierung erstellen können. Claude-Modelle zeichnen sich durch komplexe Gründe, Codegenerierung und multimodale Aufgaben wie Bildanalyse aus.

In diesem Artikel erfahren Sie, wie Sie:

Bereitstellen von Claude-Modellen in Microsoft Foundry
Authentifizieren mithilfe von Microsoft Entra ID oder API-Schlüsseln
Aufrufen der Claude Messages-API aus Python, JavaScript oder REST
Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.

Claude Modelle in Foundry umfassen:

Modellfamilie	Modelle
Claude Mythos	`claude-mythos-preview` ¹ (Gesteuertes Forschungsvorschau)
Claude Opus	`claude-opus-4-7` ² (Vorschau), `claude-opus-4-6` (Vorschau), `claude-opus-4-5` (Vorschau), `claude-opus-4-1` (Vorschau)
Claude Sonnet	`claude-sonnet-4-6` (Vorschau), `claude-sonnet-4-5` (Vorschau)
Claude Haiku	`claude-haiku-4-5` (Vorschau)

¹Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach Ermessen von Anthropic gewährt und wird für defensive Cybersicherheitsanwendungen priorisiert. Siehe die Claude Mythos Preview-Systemkarte für Anweisungen zur verantwortungsvollen Verwendung.

² Folgen Sie dem Migrationshandbuch zum Migrieren von Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7.

Weitere Informationen zu den einzelnen Modellen finden Sie unter Verfügbare Claude Modelle.

Voraussetzungen

Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Wenn Sie kein Azure-Abonnement haben, erstellen Sie ein paid Azure Konto. Weitere Details finden Sie unter Abonnementtyp- und Regionsunterstützung .
Zugriff auf Microsoft Foundry mit entsprechenden Berechtigungen zum Erstellen und Verwalten von Ressourcen.
Ein Microsoft Foundry-Projekt in einem der unterstützten Regionen erstellt: East US2 oder Sweden Central.
Foundry Models von Partnern und der Community benötigen Zugriff auf Azure Marketplace, um Abonnements zu erstellen. Stellen Sie sicher, dass Sie über die erforderlichen Berechtigungen zum Abonnieren von Modellangeboten verfügen.
„Mitwirkender“ oder „Besitzer“-Rolle in der Ressourcengruppe zum Bereitstellen von Modellen. Weitere Informationen finden Sie unter Azure RBAC-Rollen.

Support für Abonnementtyp und Region

Um Claude Modelle in Microsoft Foundry zu verwenden, müssen Sie über ein kostenpflichtiges Azure-Abonnement mit einem Abrechnungskonto in einem Land oder einer Region verfügen, in dem Anthropic die Modelle zum Kauf anbietet. Eine Liste allgemeiner Abonnementfehler finden Sie unter Allgemeine Fehlermeldungen und Lösungen. Die folgenden Abonnementtypen werden derzeit nicht unterstützt:

Unternehmenskonten in Südkorea
Cloud Solution Provider Abonnements
Azure Abonnements ohne aktive Abrechnungsmethode (z. B. Studenten-, kostenlose Test- oder Startguthabenkonten)
Gesponserte Abonnements, die nur Azure Credits verwenden. Hinweis: Wenn Sie über ein Konto mit einer Kreditkarte verfügen, wird die Kreditkarte anstelle von Azure Credits belastet.

Eine Liste der unterstützten Regionen finden Sie unter unterstützten geografischen Standorten. Beachten Sie, dass die "Richtlinie für unterstützte Regionen" von Anthropic in Ihrer Region für die Verfügbarkeit gelten kann. Überprüfen Sie unterstützte Regionen für Details.

Bereitstellen von Claude-Modellen

Claude-Modelle in Foundry sind für die globale Standardbereitstellung verfügbar. Um ein Claude-Modell bereitzustellen, befolgen Sie die Anweisungen in Deploy Microsoft Foundry Models im Foundry-Portal.

Verwenden Sie nach der Bereitstellung den Foundry-Playground , um das Modell interaktiv zu testen.

Aufrufen der Claude Messages-API

Nachdem Sie ein Claude-Modell bereitgestellt haben, interagieren Sie damit, um Textantworten zu generieren:

Verwenden Sie die Anthropic SDKs und die folgenden Claude-APIs:
- Nachrichten-API: Senden Einer strukturierten Liste von Eingabemeldungen mit Text- oder Bildinhalten. Das Modell generiert die nächste Nachricht in der Unterhaltung.
- Api für die Tokenanzahl: Zählen Sie die Anzahl der Token in einer Nachricht.
- Datei-API: Hochladen und Verwalten von Dateien für die Verwendung mit der Claude-API ohne erneutes Hochladen von Inhalten mit jeder Anforderung.
- Skills API: Erstellen benutzerdefinierter Fähigkeiten für Claude AI.

Senden von Nachrichten mit Authentifizierung

Die folgenden Beispiele zeigen, wie Anforderungen mithilfe von Microsoft Entra ID oder API-Schlüsselauthentifizierung an Claude Sonnet 4.6 gesendet werden. Um mit Ihrem bereitgestellten Modell zu arbeiten, benötigen Sie Folgendes:

Ihre Basis-URL, die dem Formular https://<resource name>.services.ai.azure.com/anthropicentspricht.
Der Ziel-URI aus den Bereitstellungsdetails, der in der Form https://<resource name>.services.ai.azure.com/anthropic/v1/messages vorliegt.
Microsoft Entra ID für die schlüssellose Authentifizierung oder den API-Schlüssel Ihrer Implementierung für die API-Authentifizierung.
Der Bereitstellungsname, den Sie während der Bereitstellungserstellung ausgewählt haben. Dieser Name kann sich von der Modell-ID unterscheiden.

Hinweis

Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Mit dem Typ adaptive kann das Modell entscheiden, ob es basierend auf der Abfragekomplexität und der Leistungsstufe denken soll.

Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.

Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.

Der effort Parameter, der den Qualitäts-/Kosten-Kompromiss für Antworten steuert, unterstützt die Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt der Parameter auch den Leistungsgrad max. Verwenden Sie diesen Parameter mit oder ohne Aktivierung der Denkfunktion.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL mit Microsoft Entra ID Authentifizierung.

Installieren Sie die Azure Identity-Clientbibliothek: Installieren Sie diese Bibliothek, um die DefaultAzureCredential zu verwenden. Die Autorisierung ist am einfachsten, wenn Sie DefaultAzureCredential verwenden, da dies die besten Anmeldeinformationen findet, die in ihrer Laufumgebung verwendet werden.
```
pip install azure-identity
```
Legen Sie die Werte der Client-ID, der Mandanten-ID und des geheimen Clientschlüssels der Microsoft Entra ID Anwendung als Umgebungsvariablen fest: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
```
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
```
Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher).
```
pip install -U "anthropic"
```

Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

Erstellen Sie einen Client mit dem Anthropic SDK mit Microsoft Entra ID Authentifizierung.
Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

from anthropic import AnthropicFoundry
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
deploymentName = "claude-sonnet-4-6" # Replace with your deployment name

# Create token provider for Entra ID authentication
tokenProvider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://ai.azure.com/.default"
)

# Create client with Entra ID authentication
client = AnthropicFoundry(
    azure_ad_token_provider=tokenProvider,
    base_url=baseURL
)

# Send request
message = client.messages.create(
    model=deploymentName,
    messages=[
        {"role": "user", "content": "What are 3 things to visit in Seattle?"}
    ],
    max_tokens=1048,
    temperature=1,
    thinking={"type":"adaptive"},
    output_config={"effort": "max"},
    stream=False
)

print(message.content)

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:Anthropic Client SDK, DefaultAzureCredential

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL und Ihren API-Schlüssel, um sich bei dem Dienst zu authentifizieren.

Install-Abhängigkeiten: Installieren Sie das Anthropic SDK mithilfe von Pip (erfordert Python 3.8 oder höher):
```
pip install -U "anthropic"
```

Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

Erstellen Sie einen Client mit dem Anthropic SDK, indem Sie Ihren API-Schlüssel an die Konfiguration des SDK übergeben. Mit dieser Authentifizierungsmethode können Sie nahtlos mit dem Dienst interagieren.
Führen Sie einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

from anthropic import AnthropicFoundry

baseURL = "https://<resource-name>.services.ai.azure.com/anthropic" # Your base URL. Replace <resource-name> with your resource name
deploymentName = "claude-sonnet-4-6" # Replace with your deployment name
apiKey = "YOUR_API_KEY" # Replace YOUR_API_KEY with your API key

# Create client with API key authentication
client = AnthropicFoundry(
    api_key=apiKey,
    base_url=baseURL
)

# Send request
message = client.messages.create(
    model=deploymentName,
    messages=[
        {"role": "user", "content": "What are 3 things to visit in Seattle?"}
    ],
    max_tokens=1048,
    temperature=1,
    thinking={"type":"adaptive"},
    output_config={"effort": "max"},
    stream=False
)

print(message.content)

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:Anthropic Client SDK

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL mit Microsoft Entra ID Authentifizierung.

Installieren Sie die Azure Identity-Clientbibliothek: Installieren Sie das paket @azure/identity, um das DefaultAzureCredential zu verwenden. Die Autorisierung ist am einfachsten, wenn Sie DefaultAzureCredential verwenden, da dies die besten Anmeldeinformationen findet, die in ihrer Laufumgebung verwendet werden.
```
npm install @azure/identity
```
Legen Sie die Werte der Client-ID, der Mandanten-ID und des geheimen Clientschlüssels der Microsoft Entra ID Anwendung als Umgebungsvariablen fest: AZURE_CLIENT_ID, AZURE_TENANT_ID, AZURE_CLIENT_SECRET.
```
export AZURE_CLIENT_ID="<AZURE_CLIENT_ID>"
export AZURE_TENANT_ID="<AZURE_TENANT_ID>"
export AZURE_CLIENT_SECRET="<AZURE_CLIENT_SECRET>"
```
Abhängigkeiten installieren
1. Installieren Sie Node.js 20 LTS oder höher (nicht EOL)-Versionen.
2. Kopieren Sie die folgenden Textzeilen, und speichern Sie sie als Datei package.json in Ihrem Ordner.
```
{
  "type": "module",
  "dependencies": {
    "@anthropic-ai/sdk": "latest",
    "@azure/identity": "latest"
  }
}
```
3. Öffnen Sie ein Terminalfenster in diesem Ordner und führen Sie den Befehl npm install aus.
4. Kopieren Sie für jeden der folgenden Codeausschnitte den Inhalt in eine Datei sample.js und führen Sie sie mit node sample.js aus.

Führen Sie ein einfaches Codebeispiel aus, um die folgenden Aufgaben auszuführen:

Erstellt einen Client mit dem Anthropic SDK unter Verwendung der Microsoft Entra ID-Authentifizierung.
Führt einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

import AnthropicFoundry from '@anthropic-ai/foundry-sdk';
import { getBearerTokenProvider, DefaultAzureCredential } from "@azure/identity";

const baseURL = "https://<resource-name>.services.ai.azure.com/anthropic"; // Your base URL. Replace <resource-name> with your resource name
const deploymentName = "claude-sonnet-4-6" // Replace with your deployment name

// Create token provider for Entra ID authentication
const tokenProvider = getBearerTokenProvider(
    new DefaultAzureCredential(),
    'https://ai.azure.com/.default');

// Create client with Entra ID authentication
const client = new AnthropicFoundry({
    azureADTokenProvider: tokenProvider,
    baseURL: baseURL,
    apiVersion: "2023-06-01"
});

// Send request
const message = await client.messages.create({
    model: deploymentName,
    messages: [{ role: "user", content: "What are 3 things to visit in Seattle?" }],
    max_tokens: 1048,
    temperature: 1,
    thinking: {"type": "adaptive"},
    output_config: {"effort": "max"},
    stream: false
});
console.log(message);

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:Anthropic Client SDK, DefaultAzureCredential

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte Ihre Basis-URL und Ihren API-Schlüssel, um sich bei dem Dienst zu authentifizieren.

Abhängigkeiten installieren
1. Installieren Sie Node.js 20 LTS oder höher (nicht EOL)-Versionen.
2. Kopieren Sie die folgenden Textzeilen, und speichern Sie sie als Datei package.json in Ihrem Ordner.
```
{
  "type": "module",
  "dependencies": {
    "@anthropic-ai/sdk": "latest"
  }
}
```
3. Öffnen Sie ein Terminalfenster in diesem Ordner und führen Sie npm install aus.
4. Kopieren Sie für jeden der folgenden Code-Snippets den Inhalt in eine Datei sample.js und führen Sie die Ausführung mit node sample.js durch.

Führen Sie ein einfaches Codebeispiel aus. In diesem Beispiel werden die folgenden Aufgaben ausgeführt:

Erstellt einen Client mit dem Anthropic SDK, indem Ihr API-Schlüssel an die Konfiguration des SDK übergeben wird. Mit dieser Authentifizierungsmethode können Sie nahtlos mit dem Dienst interagieren.
Führt einen einfachen Aufruf der Nachrichten-API durch. Der Aufruf ist synchron.

import AnthropicFoundry from '@anthropic-ai/foundry-sdk';

const baseURL = "https://<resource-name>.services.ai.azure.com/anthropic"; // Your base URL. Replace <resource-name> with your resource name
const deploymentName = "claude-sonnet-4-6" // Replace with your deployment name
const apiKey = "<your-api-key>"; // Your API key

// Create client with API key
const client = new AnthropicFoundry({
    apiKey: apiKey,
    baseURL: baseURL,
    apiVersion: "2023-06-01"
});

// Send request
const message = await client.messages.create({
    model: deploymentName,
    messages: [{ role: "user", content: "What are 3 things to visit in Seattle?" }],
    max_tokens: 1048,
    temperature: 1,
    thinking: {"type": "adaptive"},
    output_config: {"effort": "max"},
    stream: false
});
console.log(message);

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Reference:AnthropicFoundry SDK

Eine Liste der unterstützten Laufzeiten finden Sie unter Requirements zur Verwendung Anthropic TypeScript-API-Bibliothek.

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden Sie für Nachrichten-API-Endpunkte den Endpunkt-URI des bereitgestellten Modells https://<resource-name>.services.ai.azure.com/anthropic/v1/messages mit Microsoft Entra ID Authentifizierung.

Wenn Sie die Ressource mit Microsoft Entra ID Unterstützung konfigurieren, übergeben Sie Ihr Token im Autorisierungsheader mit dem Format Bearer $AZURE_AUTH_TOKEN. Verwenden Sie den Bereich https://ai.azure.com/.default. Die Verwendung von Microsoft Entra ID erfordert möglicherweise eine zusätzliche Konfiguration in Ihrer Ressource, um Zugriff zu gewähren. Weitere Informationen finden Sie unter Konfigurieren der Authentifizierung mit Microsoft Entra ID.

Exportieren Sie Ihr Microsoft Entra ID Token in eine Umgebungsvariable:

Wenn Sie Bash verwenden:
```
export AZURE_AUTH_TOKEN="<your-entra-id-key>"
```
Wenn Sie sich in PowerShell befinden:
```
$Env:AZURE_AUTH_TOKEN = "<your-entra-id-key>"
```
Wenn Sie Windows Eingabeaufforderung verwenden:
```
set AZURE_AUTH_TOKEN = <your-entra-id-key>
```

Führen Sie den folgenden cURL-Befehl aus. Verwenden Sie für cURL https://<resource-name>.services.ai.azure.com/anthropic/v1/messages den Ziel-URI Ihrer Bereitstellung.

curl -X POST https://<resource-name>.services.ai.azure.com/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_AUTH_TOKEN" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "messages": [
      {
        "role": "user", "content": "You are a helpful assistant."
      },
      {
        "role": "user", "content": "What are 3 things to visit in Seattle?"
      }
    ],
    "max_tokens": 1048,
    "temperature": 1,
    "model": "claude-sonnet-4-6",
    "thinking": {"type":"adaptive"},
    "output_config": {"effort": "max"},
    "stream": false
    }'

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Referenz:Claude Messages API

Verwenden der API-Schlüsselauthentifizierung

Wichtig

Claude Mythos Preview unterstützt nur Microsoft Entra ID Authentifizierung.

Verwenden Sie für Nachrichten-API-Endpunkte den Endpunkt-URI https://<resource-name>.services.ai.azure.com/anthropic/v1/messages und den API-Schlüssel des bereitgestellten Modells, um sich bei dem Dienst zu authentifizieren.

Exportieren Sie Ihren API-Schlüssel in eine Umgebungsvariable:

Wenn Sie Bash verwenden:
```
export AZURE_API_KEY="<your-api-key>"
```
Wenn Sie sich in PowerShell befinden:
```
$Env:AZURE_API_KEY = "<your-api-key>"
```
Wenn Sie Windows Eingabeaufforderung verwenden:
```
set AZURE_API_KEY = <your-api-key>
```

Führen Sie den folgenden cURL-Befehl aus:

curl -X POST https://<resource-name>.services.ai.azure.com/anthropic/v1/messages \
  -H "Content-Type: application/json" \
  -H "x-api-key: $AZURE_API_KEY" \
  -H "anthropic-version: 2023-06-01" \
  -d '{
    "messages": [
      {
        "role": "user", "content": "You are a helpful assistant."
      },
      {
        "role": "user", "content": "What are 3 things to visit in Seattle?"
      }
    ],
    "max_tokens": 1048,
    "temperature": 1,
    "model": "claude-sonnet-4-6",
    "thinking": {"type":"adaptive"},
    "output_config": {"effort": "max"},
    "stream": false
    }'

Erwartete Ausgabe: Eine JSON-Antwort, die den Textabschluss des Modells mit drei Seattle-Empfehlungen enthält.

Referenz:Claude Messages API

Verfügbare Claude Modelle

Foundry unterstützt Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5 Modelle über die globale Standardbereitstellung. Diese Modelle verfügen über wichtige Funktionen:

Adaptives Denken: Ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.
Erweitertes Denken: Erweiterte Begründung für komplexe Aufgaben.
Bild- und Texteingabe: Starke Vision für die Analyse von Diagrammen, technischen Diagrammen, Berichten und anderen visuellen Materialien.
Codegenerierung: Erweiterte Codegenerierung, -analyse und -debugging.

Weitere Informationen zu den Modellfunktionen finden Sie in den Funktionen von Claude-Modellen.

Claude Mythos (Gesteuerte Forschungsvorschau)

Wichtig

Claude Mythos Preview ist nur als Gated Research Preview verfügbar. Der Zugriff auf das Modell wird ausschließlich nach Ermessen von Anthropic gewährt und wird für defensive Cybersicherheitsanwendungen priorisiert. Siehe die Claude Mythos Preview-Systemkarte für Anweisungen zur verantwortungsvollen Verwendung.

Claude Mythos Preview unterstützt nur Microsoft Entra ID-Authentifizierung.

Claude Mythos Preview ist eine neue Klasse von Intelligenz, die für ehrgeizige Projekte entwickelt wurde, und das weltweit beste Modell für Cybersicherheit, autonomes Codieren und langjährige Agenten. Nur als Gated Research Preview verfügbar, wobei der Zugriff für defensive Cybersicherheits-Anwendungsfälle priorisiert ist. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K wird Claude Mythos Preview für:

Cybersicherheit: Das weltweit beste Modell für defensive Sicherheit. Es kann Korrekturen für echte Sicherheitsrisiken in Produktionscodebasen finden und vorschlagen und dann helfen, die Korrekturen zu beweisen.
Autonomes Codieren: Behandelt den vollständigen Engineering-Zyklus effektiver als jedes vorherige Modell – Untersuchung, Implementierung und Tests über große Codebasen hinweg von Ziel zu Versand.
Langlaufende Agenten: Setzt neue Maßstäbe für agentische Arbeit über einen langen Zeitraum. Sie kann eine einheitliche Durchführung über erweiterte, mehrstündige Aufgaben aufrechterhalten, sich anpassen, wenn sich die Bedingungen ändern, und die Arbeit mit weniger Eingriffen voranbringen.

Claude Mythos Preview unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Vorgangs- und Leistungsniveau so viel oder so wenig wie nötig zu denken.

Claude Opus 4.7 (Vorschau)

Tipp

Folgen Sie dem Migrationshandbuch , um Nachrichten-API-Code aus früheren Claude-Versionen zu Claude Opus 4.7 zu migrieren.

Claude Opus 4.7 ist das fähigste Modell in der Claude Opus-Familie, das die Leistung über Codierung, Unternehmensworkflows und langfristige agentische Aufgaben hinweg verbessert. Mit einem Kontextfenster von 1M-Token und einer maximalen Ausgabe von 128K ist Opus 4.7 ideal für agentische Codierung, Unternehmenswissensarbeit, langlebige Multi-Tool-Workflows, hochauflösende multimodale Begründung (bis zu 2576px / 3,75MP), Finanzanalyse und Cybersicherheit. Opus 4.7 unterstützt adaptives Denken, ein Upgrade auf erweitertes Denken, das Claude die Freiheit gibt, je nach Aufgaben- und Leistungsniveau so viel oder so wenig wie nötig zu denken.

Claude Opus 4.6 (Vorschau)

Claude Opus 4.6 ist ein hochfähiges Modell in der Claude Opus-Familie für Codierung, Unternehmensmitarbeiter und professionelle Arbeit. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K eignet sich Opus 4.6 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung.

Claude Opus 4.5 (Vorschau)

Claude Opus 4.5 ist branchenweit führend in Codierung, Agenten, Computernutzung und Unternehmensworkflows. Mit einem Kontextfenster von 200K-Token und einer maximalen Ausgabe von 64K eignet sich Opus 4.5 ideal für Produktionscode, anspruchsvolle Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendungsaufgaben.

Claude Opus 4.1 (Vorschau)

Claude Opus 4.1 ist Branchenführer für Codierung. Es bietet eine anhaltende Leistung bei lang andauernden Aufgaben, die fokussierte Anstrengungen und Tausende von Schritten erfordern, wodurch KI-Agenten erheblich mehr lösen können.

Claude Sonnet 4.6 (Vorschau)

Claude Sonnet 4.6 liefert Spitzenintelligenz in großem Maßstab – entwickelt für Programmierung, Agenten und Unternehmensworkflows. Mit einem 1M-Tokenkontextfenster und einer maximalen Ausgabe von 128K ist Sonnet 4.6 ideal für Codierung, Agents, Büroaufgaben, Finanzanalyse, Cybersicherheit und Computerverwendung geeignet.

Claude Sonnet 4.5 (Vorschau)

Warnung

1M Context Beta auf Claude Sonnet 4.5 wird nach dem 30. April 2026 eingestellt.

Ab dem 1. Mai 2026:

Anforderungen von mehr als 200K-Token, die den Beta-Header auf Sonnet 4.5 enthalten, lösen einen Fehler aus.
Anforderungen von 200K-Token oder weniger bleiben unberührt, selbst wenn der Header vorhanden ist.

Entfernen Sie zum Migrieren den context-1m-2025-08-07 Beta-Header aus Ihren Anforderungen. Für Workloads, die 1M-Kontext erfordern, migrieren Sie zu Claude Sonnet 4.6 (wobei 1M-Kontext allgemein verfügbar ist) oder zu Claude Opus 4.6 oder Claude Opus 4.7 für Workloads mit höherer Intelligenz.

Claude Sonnet 4.5 ist ein hochfähiges Modell, das für die Erstellung von realen Agenten entwickelt wurde und komplexe, langhorizonte Aufgaben verarbeitet. Es bietet eine starke Balance von Geschwindigkeit und Kosten für großvolumige Anwendungsfälle. Sonnet 4.5 bietet auch eine fortschrittliche Genauigkeit für die Computernutzung, sodass Entwickler Claude so leiten können, wie menschen es tun.

Claude Haiku 4.5 (Vorschau)

Claude Haiku 4.5 bietet nahezu Frontier-Leistung für eine breite Palette von Einsatzbereichen. Es zeichnet sich als eines der besten Programmier- und Agentenmodelle aus, mit der richtigen Geschwindigkeit und den richtigen Kosten, um kostenlose Produkte und hochskalierte Subagenten anzutreiben.

Erweiterte Merkmale und Funktionen von Claude-Modellen

Claude bei den Foundry Modellen unterstützt erweiterte Funktionen. Kernfunktionen verbessern die grundlegenden Fähigkeiten von Claude für die Verarbeitung, Analyse und Generierung von Inhalten in verschiedenen Formaten und Anwendungsfällen. Mit Tools kann Claude mit externen Systemen interagieren, Code ausführen und automatisierte Aufgaben über verschiedene Toolschnittstellen ausführen.

Einige der Kernfunktionen , die Foundry unterstützt, sind:

Großes Kontextfenster: Ein erweitertes Kontextfenster, das größere Dokumente und längere Unterhaltungen verarbeitet.
Agent-Fähigkeiten: Erweitern Sie Claudes Fähigkeiten mit Fähigkeiten.
Zitate: Die Antworten von Claude sollten in Quelldokumenten verankert werden.
Kontextbearbeitung: Verwalten Sie den Unterhaltungskontext automatisch mit konfigurierbaren Strategien.
Erweitertes Denken: Erweiterte Logikfunktionen für komplexe Aufgaben, die mit allen Claude-Modellen zur Verfügung stehen.

Tipp

Für Opus 4.6 und Sonnet 4.6 unterstützt der thinking Parameter Typen: enabled, , disabledund adaptive. Mit dem Typ adaptive kann das Modell entscheiden, ob es basierend auf der Abfragekomplexität und der Leistungsstufe denken soll.

Für Mythos Preview unterstützt der thinking Parameter nuradaptive und enabled.

Für Opus 4.7 unterstützt der thinking Parameter nuradaptive und disabled.
Anstrengung: Möglichkeit, den Qualitäts-/Kosten-Kompromiss für Antworten zu kontrollieren.

Tipp

Der effort Parameter unterstützt Leistungsstufen: low, , mediumund high. Für Opus 4.7, Opus 4.6 und Sonnet 4.6 unterstützt der Parameter auch den Leistungsgrad max. Verwenden Sie diesen Parameter mit oder ohne Aktivierung der Denkfunktion.
PDF-Unterstützung: Verarbeiten und Analysieren von Text und visuellen Inhalten aus PDF-Dokumenten.

Einige der Tools , die Foundry unterstützt, sind:

MCP-Connector: Stellen Sie eine direkte Verbindung mit Remote-MCP-Servern über die Nachrichten-API ohne einen separaten MCP-Client her.
Speicher: Speichern und Abrufen von Informationen über Unterhaltungen hinweg. Erstellen Sie im Laufe der Zeit Wissensbasen, pflegen Sie den Projektkontext und lernen Sie aus früheren Interaktionen.
Web-Abruf: Abrufen vollständiger Inhalte aus angegebenen Webseiten und PDF-Dokumenten für eine eingehende Analyse.

Eine vollständige Liste der unterstützten Funktionen und Tools finden Sie in der Übersicht über die Features von Claude.

Agentensupport

Microsoft Agent Framework unterstützt das Erstellen von Agents, die Claude-Modelle verwenden.
Erstellen Sie benutzerdefinierte KI-Agents mit dem Claude Agent SDK.

API-Kontingente und -Grenzwerte

Wichtig

Derzeit sind nur Enterprise- und MCA-E-Abonnements für die Claude-Modellnutzung in Foundry berechtigt.

Claude Modelle in Foundry haben die folgenden Geschwindigkeitsgrenzwerte, gemessen in Token pro Minute (TPM) und Anforderungen pro Minute (RPM):

Modell	Bereitstellungstyp	Enterprise und MCA-E RPM	Enterprise- und MCA-E-TPM
claude-opus-4-7	Globaler Standard	2.000	2,000,000
claude-opus-4-6	Globaler Standard	2.000	2,000,000
claude-opus-4-5	Globaler Standard	2.000	2,000,000
claude-opus-4-1	Globaler Standard	2.000	2,000,000
claude-sonnet-4-6	Globaler Standard	2.000	2,000,000
claude-sonnet-4-5	Globaler Standard	4,000	2,000,000
claude-haiku-4-5	Globaler Standard	4,000	4.000.000

Um Ihr Kontingent über die Standardgrenzwerte hinaus zu erhöhen, senden Sie eine Anforderung über das Anforderungsformular zur Erhöhung des Kontingents.

Bewährte Methoden für Zinslimits

So optimieren Sie Ihre Nutzung und vermeiden Sie eine Begrenzung der Rate:

Implementieren Sie Retry-Logik: Behandeln von 429-Antworten mit exponentiellem Backoff.
Batchanforderungen: Kombinieren Sie nach Möglichkeit mehrere Eingabeaufforderungen.
Überwachen Sie die Verwendung: Verfolgen Sie Ihre Tokennutzung und Anforderungsmuster.
Verwenden Sie geeignete Modelle: Wählen Sie das richtige Claude-Modell für Ihren Anwendungsfall aus.

Verantwortungsvolle KI-Überlegungen

Berücksichtigen Sie bei der Verwendung von Claude-Modellen in Gießerei die folgenden verantwortungsvollen KI-Praktiken:

Konfigurieren Sie die KI-Inhaltssicherheit während der Modell-Ableitung, da Foundry zur Bereitstellungszeit keine integrierte Inhaltsfilterung für Claude-Modelle bereitstellt.
Stellen Sie sicher, dass Ihre Anwendungen Anthropic zulässige Nutzungsrichtlinie einhalten. Weitere Informationen zu Sicherheitsbewertungen für Claude Mythos Preview, Claude Opus 4.7, Claude Opus 4.6, Claude Opus 4.5, Claude Opus 4.1, Claude Sonnet 4.6, Claude Sonnet 4.5 und Claude Haiku 4.5.

Bewährte Methoden

Befolgen Sie die folgenden bewährten Methoden beim Arbeiten mit Claude-Modellen in Foundry:

Modellauswahl

Wählen Sie das entsprechende Claude-Modell basierend auf Ihren spezifischen Anforderungen aus:

Claude Mythos Preview: Für defensive Cybersicherheit, autonomes Codieren und langjährige Agenten.
Claude Opus 4.7: Am besten geeignetes Modell für Codierung, Unternehmensworkflows und langfristige agentische Aufgaben.
Claude Opus 4.6: Hochfähiges Modell zum Erstellen von Agenten, Codierung und Unternehmensworkflows.
Claude Opus 4.5: Optimale Leistung für Codierung, Agents, Computernutzung und Unternehmensworkflows.
Claude Opus 4.1: Komplexes Denken und Unternehmensanwendungen.
Claude Sonnet 4.6: Grenzintelligenz im Maßstab für Codierung, Agenten und die meisten Anwendungsfälle.
Claude Sonnet 4.5: Ausgewogene Leistung und Fähigkeiten, Produktionsabläufe.
Claude Haiku 4.5: Geschwindigkeit und Kostenoptimierung, Verarbeitung mit hohem Volumen.

Prompt-Entwicklung

Klare Anweisungen: Geben Sie bestimmte und detaillierte Eingabeaufforderungen an.
Kontextverwaltung: Verwenden Sie das verfügbare Kontextfenster effektiv.
Rollendefinitionen: Verwenden Sie Systemmeldungen, um die Rolle und das Verhalten des Assistenten zu definieren.
Strukturierte Eingabeaufforderungen: Verwenden Sie eine konsistente Formatierung, um bessere Ergebnisse zu erzielen.

Kostenoptimierung

Tokenverwaltung: Überwachen und Optimieren der Tokennutzung.
Modellauswahl: Verwenden Sie das kostengünstigste Modell für Ihren Anwendungsfall.
Batchverarbeitung anfordern: Kombinieren Sie nach Möglichkeit mehrere Anforderungen.

Problembehandlung

In der folgenden Tabelle sind häufige Fehler und deren Lösungen aufgeführt, die auftreten, wenn Sie mit Claude-Modellen in Foundry arbeiten:

Fehler	Ursache	Lösung
401 Nicht autorisiert	Ungültiger oder abgelaufener API-Schlüssel oder ungültiger Entra ID Tokenbereich.	Überprüfen Sie, ob der API-Schlüssel korrekt ist. Bestätigen Sie für Entra ID, dass Sie den Bereich `https://ai.azure.com/.default` verwenden.
403 Verboten	Unzureichende Berechtigungen für die Ressource oder das Abonnement.	Vergewissern Sie sich, dass Sie über die Rolle "Mitwirkender " oder "Besitzer " in der Ressourcengruppe verfügen. Stellen Sie für Entra ID sicher, dass die Rolle Cognitive Services User zugewiesen ist.
404 nicht gefunden	Falsche Endpunkt-URL oder Bereitstellungsname.	Vergewissern Sie sich, dass Ihre Basis-URL dem Muster `https://<resource-name>.services.ai.azure.com/anthropic` folgt, und der Bereitstellungsname entspricht Ihrer Konfiguration.
429 zu viele Anforderungen	Das Limit für Ihre Abonnementstufe wurde überschritten.	Implementieren Sie exponentielle Backoffs mit Wiederholungslogik. Erwägen Sie, die Anforderungshäufigkeit zu reduzieren oder eine Kontingenterhöhung anzufordern.
Fehler bei der Abonnementberechtigung	Nicht-Enterprise- oder nicht-MCA-E-Abonnement.	Claude-Modelle erfordern ein Enterprise- oder MCA-E-Abonnement. Details finden Sie unter API-Kontingente und -Grenzwerte .
Region nicht verfügbar	Die Bereitstellung wurde in einer nicht unterstützten Region durchgeführt.	Stellen Sie in Ost-USA2 oder Zentral-Schweden, den unterstützten Regionen für Claude-Modelle, bereit.

Feedback

War diese Seite hilfreich?

Last updated on 2026-05-11

Bereitstellen und Verwenden von Claude-Modellen in Microsoft Foundry (Vorschau)

Voraussetzungen

Support für Abonnementtyp und Region

Bereitstellen von Claude-Modellen

Aufrufen der Claude Messages-API

Senden von Nachrichten mit Authentifizierung

Verwenden Sie die Microsoft Entra ID-Authentifizierung

Verwenden der API-Schlüsselauthentifizierung

Verfügbare Claude Modelle

Claude Mythos (Gesteuerte Forschungsvorschau)

Claude Opus 4.7 (Vorschau)

Claude Opus 4.6 (Vorschau)

Claude Opus 4.5 (Vorschau)

Claude Opus 4.1 (Vorschau)

Claude Sonnet 4.6 (Vorschau)

Claude Sonnet 4.5 (Vorschau)

Claude Haiku 4.5 (Vorschau)

Erweiterte Merkmale und Funktionen von Claude-Modellen

Agentensupport

API-Kontingente und -Grenzwerte

Bewährte Methoden für Zinslimits

Verantwortungsvolle KI-Überlegungen

Bewährte Methoden

Modellauswahl

Prompt-Entwicklung

Kostenoptimierung

Problembehandlung

Verwandte Inhalte

Feedback

Zusätzliche Ressourcen