Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Wenn Sie ein Modell in Microsoft Foundry in Azure Government bereitstellen, wählen Sie einen Bereitstellungstyp aus, der Folgendes bestimmt:
- Wo Ihre Daten verarbeitet werden (Datenzone oder einzelne Region)
- Zahlungsweise (Pay-per-Token oder reservierte Kapazität)
- Leistungsmerkmale (Latenzabweichung, Durchsatzgrenzwerte)
Der Dienst bietet zwei Hauptkategorien: standard (Pay-per-Token) und provisionedmanaged (reservierte Kapazität). Innerhalb jeder Kategorie können Sie datenzone oder einzelne regionale Verarbeitung basierend auf Ihren Anforderungen auswählen.
Wichtig
Datenresidenz für alle Bereitstellungstypen: Ruhende Daten bleiben in der spezifizierten Azure-Region gespeichert. Allerdings werden Schlussfolgerungsdaten wie folgt verarbeitet:
- USGov DataZoneTypen: Verarbeitet nur innerhalb der Azure Government Cloud USGov-Datenzone
- Standard-/Regionaltypen : Verarbeitet in der Bereitstellungsregion
Vergleich der Bereitstellungsarten
| Bereitstellungstyp | SKU-Code | Datenverarbeitung | Abrechnung | Am besten geeignet für |
|---|---|---|---|---|
| Datenzonenstandard | DataZoneStandard |
Innerhalb der Datenzone | Pay-per-Token | USGov-Datenzonenkompatibilität |
| Bereitgestellte Datenzone | DataZoneProvisionedManaged |
Innerhalb der Datenzone | Reservierte PTU | USGov Data Zone + vorhersagbarer Durchsatz |
| Standard | Standard |
Einzelne Region | Pay-per-Token | Regionale Compliance, geringes Volumen |
| Regionale Bereitstellung | ProvisionedManaged |
Einzelne Region | Reservierte PTU | Regionale Compliance + Durchsatz |
Hinweis
Nicht alle Modelle unterstützen alle Bereitstellungstypen. Überprüfen Sie Foundry-Modelle, die direkt von Azure auf Modellverfügbarkeit nach Bereitstellungstyp und Region verkauft werden.
Hinweis
SLA-Garantien variieren je nach Bereitstellungstyp. Bereitgestellte Typen bieten garantierten Durchsatz und geringere Latenzabweichung. Standardtypen bieten Best-Effort-Service. Ausführliche Informationen finden Sie im Azure SLA für den Azure OpenAI Service.
Tipp
Detaillierte Preise finden Sie unter Azure OpenAI Service Pricing.
Auswählen des richtigen Bereitstellungstyps
Verwenden Sie die folgenden Kriterien, um einen Bereitstellungstyp auszuwählen:
Nach Datenresidenzanforderung
- USGov-Datenzone: Verwenden von DataZone Standard oder DataZone Provisioned in einer Azure Government Region
- Nur eine Region: Standard- oder Regionalbereitstellung verwenden
Nach Arbeitsauslastungsmuster
- Variabler, burstartiger Netzwerkverkehr: Standard oder DataZone (Pay-per-Token) verwenden
- Konsistentes hohes Volumen: Verwenden von bereitgestellten Typen (reservierte Kapazität)
Je nach Latenzanforderung
- Niedrige Latenzvarianz erforderlich: Verwenden Sie bereitgestellte Typen
- Latenzabweichung akzeptabel: Standardtypen verwenden
Datenzonen-Bereitstellungen
Für DataZone-Bereitstellungstypen werden Eingabeaufforderungen und Antworten nur innerhalb der angegebenen Datenzone verarbeitet:
- USGov: Innerhalb der beiden Azure Government Regionen verarbeitete Daten (USGovArizona oder USGovVirginia)
Weitere Informationen finden Sie im Abschnitt "Modellregionenverfügbarkeit nach Bereitstellungstyp" von Foundry Models, die direkt von Azure verkauft werden.
Hinweis
Wenn es bei der Bereitstellung vom Typ Data Zone Standard in der primären Region zu einer Dienstunterbrechung kommt, ist der gesamte Datenverkehr, der ursprünglich an diese Region weitergeleitet wird, betroffen. Weitere Informationen finden Sie im Handbuch für hohe Verfügbarkeit und Notfallwiederherstellung.
Datenzonenstandard
- SKU-Name im Code:
DataZoneStandard
Data Zone Standard-Bereitstellungen leiten Datenverkehr dynamisch an Rechenzentren innerhalb der Microsoft definierten Datenzone (USGov) weiter. Dieser Bereitstellungstyp bietet höhere Standardkontingente als geografiebasierte Bereitstellungstypen, während Daten innerhalb der angegebenen Zone beibehalten werden.
Kunden mit hohem konsistenten Volumen können eine höhere Latenzvariabilität aufweisen. Der Schwellenwert wird pro Modell festgelegt. Weitere Informationen zu Azure OpenAI-Kontingenten in Azure Government finden Sie unter Quotas und Beschränkungen in Azure OpenAI. Bei Workloads, die eine geringe Latenzabweichung bei großem Volumen erfordern, sollten Sie provisionierte Bereitstellungstypen in Betracht ziehen.
Bereitgestellte Datenzone
- SKU-Name im Code:
DataZoneProvisionedManaged
Data Zone Provisioned-Bereitstellungen leiten den Datenverkehr dynamisch innerhalb der von Microsoft vorgegebenen Datenzone (USGov) weiter, während reservierte Modellverarbeitungskapazität bereitgestellt wird. Dieser Bereitstellungstyp kombiniert die Datenzonenkonformität mit hohem und vorhersehbaren Durchsatz.
Standard
- SKU-Name im Code:
Standard
Standardbereitstellungen verwenden die Abrechnung pro Token. Sie zahlen nur für das, was Sie verbrauchen. Modelle, die in den einzelnen Regionen verfügbar sind, und der Durchsatz können eingeschränkt sein.
Standardbereitstellungen eignen sich für Workloads mit geringem bis mittlerem Volumen und hoher Burstneigung. Kunden mit hohem konsistenten Volumen können eine höhere Latenzvariabilität aufweisen.
Regionale Bereitstellung
- SKU-Name im Code:
ProvisionedManaged
Mit regionalen bereitgestellten Bereitstellungen können Sie den in einer Bereitstellung erforderlichen Durchsatz angeben. Der Dienst weist dann die erforderliche Modellverarbeitungskapazität zu und stellt sicher, dass er für Sie bereit ist. Der Durchsatz wird in Bezug auf bereitgestellte Durchsatzeinheiten (PTUs) definiert, was eine normalisierte Möglichkeit ist, den Durchsatz für Ihre Bereitstellung darzustellen. Jedes Modellversionspaar erfordert unterschiedliche Mengen von PTUs für die Bereitstellung und stellt unterschiedliche Durchsatzmengen pro PTU bereit. Die mindesten PTU-Anforderungen variieren je nach Modell. Aktuelle Mindestwerte und verfügbare Kapazität finden Sie unter Bereitgestellte Durchsatzkonzepte.
Lösungen für Probleme bei der Bereitstellung
Häufige Probleme beim Erstellen oder Verwenden von Bereitstellungen:
| Angelegenheit | Ursache | Auflösung |
|---|---|---|
| Bereitstellungstyp nicht verfügbar | Das Modell unterstützt den ausgewählten Typ nicht. | Überprüfen der Modellverfügbarkeit nach Bereitstellungstyp |
| Kontingent überschritten | Abonnementgrenzwert für Token pro Minute erreicht | Anfordern einer Erhöhung des Kontingents auf Azure Government AOAI Quota oder Verwenden einer anderen Region |
| Region nicht verfügbar | Modell nicht in ausgewählter Region bereitgestellt | Auswählen einer Region aus der Verfügbarkeitsliste des Modells |
| Bereitgestellte Kapazität nicht verfügbar | Keine PTU-Kapazität in Region | Probieren Sie eine andere Region aus, oder verwenden Sie DataZone Provisioned für eine breitere Verfügbarkeit |
Informationen zu Azure OpenAI-Kontingentbeschränkungen nach Bereitstellungstyp in Azure Government finden Sie unter Quotas und Grenzwerte in Azure OpenAI.
Missbrauchsüberwachung in Azure Government
Nicht alle Features der Missbrauchsüberwachung sind für Azure OpenAI-Bereitstellungen in Azure Government aktiviert. Sie sind dafür verantwortlich, angemessene technische und operative Maßnahmen zu implementieren, um jegliche Nutzung des Dienstes zu erkennen und zu mindern, die gegen die Produktbedingungen verstoßen. Die automatische Inhaltsklassifizierung und -filterung bleibt für Azure Government standardmäßig aktiviert. Wenn geänderte Inhaltsfilter erforderlich sind, wenden Sie sich bei Azure Government Modified Filter Application an.
Verwandte Inhalte
- Deploy Microsoft Foundry Models im Foundry-Portal
- Erstellen und Bereitstellen einer Azure OpenAI-Ressource in Microsoft Foundry-Modellen
- Foundry-Modelle, die direkt von Azure in Azure Government verkauft werden
- Modellregionsverfügbarkeit nach Bereitstellungstyp in Azure Government
- Azure OpenAI in Azure Government Kontingente und Einschränkungen
- Bereitgestellte Durchsatzkonzepte
- Azure OpenAI Service Preise
- Datenschutz und Sicherheit für Foundry Models
- Hohe Verfügbarkeit und Notfallwiederherstellung