Bereitstellungstypen für Microsoft Foundry Models in Azure Government

Wenn Sie ein Modell in Microsoft Foundry in Azure Government bereitstellen, wählen Sie einen Bereitstellungstyp aus, der Folgendes bestimmt:

  • Wo Ihre Daten verarbeitet werden (Datenzone oder einzelne Region)
  • Zahlungsweise (Pay-per-Token oder reservierte Kapazität)
  • Leistungsmerkmale (Latenzabweichung, Durchsatzgrenzwerte)

Der Dienst bietet zwei Hauptkategorien: standard (Pay-per-Token) und provisionedmanaged (reservierte Kapazität). Innerhalb jeder Kategorie können Sie datenzone oder einzelne regionale Verarbeitung basierend auf Ihren Anforderungen auswählen.

Screenshot des Bereitstellungsdialogs im Foundry-Portal, der das Auswahlfeld für den Bereitstellungstyp zeigt, wobei die Option

Wichtig

Datenresidenz für alle Bereitstellungstypen: Ruhende Daten bleiben in der spezifizierten Azure-Region gespeichert. Allerdings werden Schlussfolgerungsdaten wie folgt verarbeitet:

  • USGov DataZoneTypen: Verarbeitet nur innerhalb der Azure Government Cloud USGov-Datenzone
  • Standard-/Regionaltypen : Verarbeitet in der Bereitstellungsregion

Vergleich der Bereitstellungsarten

Bereitstellungstyp SKU-Code Datenverarbeitung Abrechnung Am besten geeignet für
Datenzonenstandard DataZoneStandard Innerhalb der Datenzone Pay-per-Token USGov-Datenzonenkompatibilität
Bereitgestellte Datenzone DataZoneProvisionedManaged Innerhalb der Datenzone Reservierte PTU USGov Data Zone + vorhersagbarer Durchsatz
Standard Standard Einzelne Region Pay-per-Token Regionale Compliance, geringes Volumen
Regionale Bereitstellung ProvisionedManaged Einzelne Region Reservierte PTU Regionale Compliance + Durchsatz

Hinweis

Nicht alle Modelle unterstützen alle Bereitstellungstypen. Überprüfen Sie Foundry-Modelle, die direkt von Azure auf Modellverfügbarkeit nach Bereitstellungstyp und Region verkauft werden.

Hinweis

SLA-Garantien variieren je nach Bereitstellungstyp. Bereitgestellte Typen bieten garantierten Durchsatz und geringere Latenzabweichung. Standardtypen bieten Best-Effort-Service. Ausführliche Informationen finden Sie im Azure SLA für den Azure OpenAI Service.

Tipp

Detaillierte Preise finden Sie unter Azure OpenAI Service Pricing.

Auswählen des richtigen Bereitstellungstyps

Verwenden Sie die folgenden Kriterien, um einen Bereitstellungstyp auszuwählen:

Nach Datenresidenzanforderung

  • USGov-Datenzone: Verwenden von DataZone Standard oder DataZone Provisioned in einer Azure Government Region
  • Nur eine Region: Standard- oder Regionalbereitstellung verwenden

Nach Arbeitsauslastungsmuster

  • Variabler, burstartiger Netzwerkverkehr: Standard oder DataZone (Pay-per-Token) verwenden
  • Konsistentes hohes Volumen: Verwenden von bereitgestellten Typen (reservierte Kapazität)

Je nach Latenzanforderung

  • Niedrige Latenzvarianz erforderlich: Verwenden Sie bereitgestellte Typen
  • Latenzabweichung akzeptabel: Standardtypen verwenden

Datenzonen-Bereitstellungen

Für DataZone-Bereitstellungstypen werden Eingabeaufforderungen und Antworten nur innerhalb der angegebenen Datenzone verarbeitet:

  • USGov: Innerhalb der beiden Azure Government Regionen verarbeitete Daten (USGovArizona oder USGovVirginia)

Weitere Informationen finden Sie im Abschnitt "Modellregionenverfügbarkeit nach Bereitstellungstyp" von Foundry Models, die direkt von Azure verkauft werden.

Hinweis

Wenn es bei der Bereitstellung vom Typ Data Zone Standard in der primären Region zu einer Dienstunterbrechung kommt, ist der gesamte Datenverkehr, der ursprünglich an diese Region weitergeleitet wird, betroffen. Weitere Informationen finden Sie im Handbuch für hohe Verfügbarkeit und Notfallwiederherstellung.

Datenzonenstandard

  • SKU-Name im Code: DataZoneStandard

Data Zone Standard-Bereitstellungen leiten Datenverkehr dynamisch an Rechenzentren innerhalb der Microsoft definierten Datenzone (USGov) weiter. Dieser Bereitstellungstyp bietet höhere Standardkontingente als geografiebasierte Bereitstellungstypen, während Daten innerhalb der angegebenen Zone beibehalten werden.

Kunden mit hohem konsistenten Volumen können eine höhere Latenzvariabilität aufweisen. Der Schwellenwert wird pro Modell festgelegt. Weitere Informationen zu Azure OpenAI-Kontingenten in Azure Government finden Sie unter Quotas und Beschränkungen in Azure OpenAI. Bei Workloads, die eine geringe Latenzabweichung bei großem Volumen erfordern, sollten Sie provisionierte Bereitstellungstypen in Betracht ziehen.

Bereitgestellte Datenzone

  • SKU-Name im Code: DataZoneProvisionedManaged

Data Zone Provisioned-Bereitstellungen leiten den Datenverkehr dynamisch innerhalb der von Microsoft vorgegebenen Datenzone (USGov) weiter, während reservierte Modellverarbeitungskapazität bereitgestellt wird. Dieser Bereitstellungstyp kombiniert die Datenzonenkonformität mit hohem und vorhersehbaren Durchsatz.

Standard

  • SKU-Name im Code: Standard

Standardbereitstellungen verwenden die Abrechnung pro Token. Sie zahlen nur für das, was Sie verbrauchen. Modelle, die in den einzelnen Regionen verfügbar sind, und der Durchsatz können eingeschränkt sein.

Standardbereitstellungen eignen sich für Workloads mit geringem bis mittlerem Volumen und hoher Burstneigung. Kunden mit hohem konsistenten Volumen können eine höhere Latenzvariabilität aufweisen.

Regionale Bereitstellung

  • SKU-Name im Code: ProvisionedManaged

Mit regionalen bereitgestellten Bereitstellungen können Sie den in einer Bereitstellung erforderlichen Durchsatz angeben. Der Dienst weist dann die erforderliche Modellverarbeitungskapazität zu und stellt sicher, dass er für Sie bereit ist. Der Durchsatz wird in Bezug auf bereitgestellte Durchsatzeinheiten (PTUs) definiert, was eine normalisierte Möglichkeit ist, den Durchsatz für Ihre Bereitstellung darzustellen. Jedes Modellversionspaar erfordert unterschiedliche Mengen von PTUs für die Bereitstellung und stellt unterschiedliche Durchsatzmengen pro PTU bereit. Die mindesten PTU-Anforderungen variieren je nach Modell. Aktuelle Mindestwerte und verfügbare Kapazität finden Sie unter Bereitgestellte Durchsatzkonzepte.

Lösungen für Probleme bei der Bereitstellung

Häufige Probleme beim Erstellen oder Verwenden von Bereitstellungen:

Angelegenheit Ursache Auflösung
Bereitstellungstyp nicht verfügbar Das Modell unterstützt den ausgewählten Typ nicht. Überprüfen der Modellverfügbarkeit nach Bereitstellungstyp
Kontingent überschritten Abonnementgrenzwert für Token pro Minute erreicht Anfordern einer Erhöhung des Kontingents auf Azure Government AOAI Quota oder Verwenden einer anderen Region
Region nicht verfügbar Modell nicht in ausgewählter Region bereitgestellt Auswählen einer Region aus der Verfügbarkeitsliste des Modells
Bereitgestellte Kapazität nicht verfügbar Keine PTU-Kapazität in Region Probieren Sie eine andere Region aus, oder verwenden Sie DataZone Provisioned für eine breitere Verfügbarkeit

Informationen zu Azure OpenAI-Kontingentbeschränkungen nach Bereitstellungstyp in Azure Government finden Sie unter Quotas und Grenzwerte in Azure OpenAI.

Missbrauchsüberwachung in Azure Government

Nicht alle Features der Missbrauchsüberwachung sind für Azure OpenAI-Bereitstellungen in Azure Government aktiviert. Sie sind dafür verantwortlich, angemessene technische und operative Maßnahmen zu implementieren, um jegliche Nutzung des Dienstes zu erkennen und zu mindern, die gegen die Produktbedingungen verstoßen. Die automatische Inhaltsklassifizierung und -filterung bleibt für Azure Government standardmäßig aktiviert. Wenn geänderte Inhaltsfilter erforderlich sind, wenden Sie sich bei Azure Government Modified Filter Application an.