Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här artikeln visar hur du distribuerar en containerbaserad agent till Foundry Agent Service med hjälp av Python SDK eller REST API. Använd dessa metoder när du vill hantera agentdistributioner direkt från dina egna program eller tjänster.
Om du distribuerar för första gången eller vill ha den snabbaste sökvägen använder du snabbstarten: Skapa och distribuera en värdbaserad agent i stället. I snabbstarten används Azure Developer CLI (azd) eller VS Code-tillägget, som hanterar konfiguration av skapande, push-överföring, versionshantering och RBAC automatiskt.
Distributionslivscykel
Varje värdbaserad agentdistribution följer den här sekvensen:
- Build och push – Paketera agentkoden i en containeravbildning och skicka den till Azure Container Registry.
- Skapa en agentversion – Registrera avbildningen med Foundry Agent Service. Plattformen etablerar infrastrukturen och skapar en dedikerad Entra-agentidentitet.
-
Sök efter status – Vänta tills versionsstatusen har nått
active. - Invoke – Skicka begäranden till agentens dedikerade slutpunkt.
Förutsättningar
- Ett Microsoft Foundry-projekt.
- Agentkod med ett ramverk som stöds.
- Docker Desktop installerat för utveckling av lokala containrar.
- Azure CLI version 2.80 eller senare.
Nödvändiga behörigheter
Du behöver Azure AI Project Manager vid projektomfattning för att skapa och distribuera värdbaserade agenter. Den här rollen omfattar både behörigheter för dataplanet för att skapa agenter och möjligheten att tilldela Azure AI-användare roll till den plattformsskapade agentidentiteten. Agentidentiteten behöver Azure AI-användare i projektet för att få åtkomst till modeller och artefakter under körning.
Om du använder azd eller VS Code-tillägget hanterar verktygen de flesta RBAC-tilldelningar automatiskt, inklusive:
- Container Registry Repository Reader för hanterad projektidentitet (bildhämtningar)
- Azure AI User för den plattformsskapade agentidentiteten (runtime-modell och verktygsåtkomst)
Observera
Plattformen skapar en dedikerad Entra-agentidentitet för varje värdbaserad agent vid distributionstillfället. Den här identiteten är ett tjänstehuvudnamn som din körande container använder för att anropa modeller och verktyg. Du behöver inte konfigurera hanterade identiteter manuellt. Den användare som skapar agenten måste dock ha behörighet att tilldela Azure AI User till den identiteten – därför rekommenderas Azure AI Project Manager istället för Azure AI User på egen hand.
Observera
Även om azd- och VS Code-tillägg hanterar grundläggande RBAC-tilldelningar automatiskt, kan komplexa scenarier kräva ytterligare manuell konfiguration. Omfattande information om alla behörigheter och rolltilldelningar finns i Referens för värdbaserade agentbehörigheter.
Mer information finns i Autentisering och auktorisering.
Viktigt
Den Azure Container Registry som innehåller den värdbaserade agentens containeravbildning måste för närvarande kunna nås via den offentliga slutpunkten. Att placera registret bakom ett privat nätverk (privat slutpunkt med åtkomst till offentligt nätverk inaktiverad) stöds inte för närvarande för värdbaserade agenter – plattformen kan inte hämta avbildningen. En fullständig lista över nätverksbegränsningar finns i Begränsningar.
Containerkrav
Containeravbildningen måste uppfylla följande krav för att köras på den värdbaserade agentplattformen.
Viktigt
Värdplattformen kräver x86_64 (linux/amd64) containeravbildningar. Om du bygger på Apple Silicon eller andra ARM-baserade datorer kan du använda docker build --platform linux/amd64 . för att undvika att skapa en inkompatibel ARM-avbildning.
Protokollbibliotek
Värdbaserade agenter kommunicerar med Foundry-gatewayen via protokollbibliotek. Välj det protokoll som matchar agentens interaktionsmönster:
| Protokollet | Python bibliotek | .NET bibliotek | Slutpunkt | Bäst för |
|---|---|---|---|---|
| Svaren | azure-ai-agentserver-responses |
Azure.AI.AgentServer.Responses |
/responses |
Konversationschattrobotar, strömning, multi-turn med plattformshanterad historik |
| Anrop | azure-ai-agentserver-invocations |
Azure.AI.AgentServer.Invocations |
/invocations |
Webhook-mottagare, icke-konversationsbearbetning, anpassade asynkrona arbetsflöden |
En enda container kan exponera båda protokollen samtidigt genom att deklarera både när du skapar agenten – i filen, SDK-anropet agent.yaml eller REST API-begäran – och genom att importera båda biblioteken. Använd protokollbiblioteken inom ditt befintliga ramverk, oavsett om det är Microsoft Agent Framework, LangChain eller anpassad kod.
Protokollbibliotek för svar
Biblioteken Python och .NET för protokollet Svar implementerar API:et Azure AI-svar. Importera paketet och implementera IResponseHandler gränssnittet. Biblioteket hanterar routning, strömning med serverutskickade händelser (SSE), bakgrundskörning, annullering, cachelagring och livscykelhantering för svar.
IResponseHandler
IResponseHandler är den kärnabstraktion som du implementerar. Biblioteket anropar CreateAsync för varje inkommande begäran och levererar via SSE de returnerade IAsyncEnumerable<ResponseStreamEvent> till klienterna.
public class EchoHandler : ResponseHandler
{
public override IAsyncEnumerable<ResponseStreamEvent> CreateAsync(
CreateResponse request,
ResponseContext context,
CancellationToken cancellationToken)
{
return new TextResponse(context, request,
createText: async ct =>
{
var input = await context.GetInputTextAsync(cancellationToken: ct);
return $"Echo: {input}";
});
}
}
ResponseEventStream
ResponseEventStream
sequenceNumber hanterar outputIndex, contentIndex, itemId och hela Response livscykeln automatiskt. Varje yield return mappar en-till-en till en SSE-händelse, så du behöver inte själv spåra detta tillstånd.
Strömnings- och bakgrundslägen
- Strömningsläge (standard): SSE-händelser levereras i realtid till den anslutna klienten.
-
Bakgrundsläge: Hanteraren körs till slutförande utan en ansluten SSE-klient. Händelser är buffrade samt tillgängliga för uppspelning via
GET /responses/{id}.
Svarslivscykel
Biblioteket samordnar hela svarslivscykeln: created → in_progress → completed (eller failed eller cancelled). Biblioteket hanterar även annullering, felhantering och terminalhändelsegarantier automatiskt.
Trådsäkerhet
Alla tjänstinstanser som registreras via AddResponsesServer() är trådsäkra. Handlerinstanser är avgränsade per begäran.
Detaljerade riktlinjer för hanteringsimplementering finns i implementeringsguiden för handler. Körbara exempel finns i protokollexemplen Responses.
Hälsoslutpunkter
Protokollbiblioteken exponerar automatiskt en /readiness slutpunkt för plattformshälsokontroller. Du behöver inte implementera detta själv.
Port
Containrar hanterar trafik på port 8088 lokalt. I produktion hanterar Foundry-gatewayen routning – containern behöver inte exponera en offentlig port.
Plattformsinmatade miljövariabler
Den värdbaserade agentplattformen matar automatiskt in miljövariabler i containern vid körning. Koden kan läsa dessa utan att deklarera dem i agent.yaml eller environment_variables. Prefixet FOUNDRY_* är reserverat för plattformsanvändning.
| Variabel | Syfte |
|---|---|
FOUNDRY_PROJECT_ENDPOINT |
Endpoint-URL för Foundry-projekt |
FOUNDRY_PROJECT_ARM_ID |
Gjuteriprojektet – ARM-resurs-ID |
FOUNDRY_AGENT_NAME |
Namn på den körande agenten |
FOUNDRY_AGENT_VERSION |
Version av agenten som körs |
FOUNDRY_AGENT_SESSION_ID |
Sessions-ID för den aktuella begäran (endast värdbaserade containrar) |
APPLICATIONINSIGHTS_CONNECTION_STRING |
Telemetri-anslutningssträng för Application Insights |
Omdeklarera inte plattformsinmatade variabler i agent.yaml – de anges automatiskt.
Variabler som du deklarerar själv, till exempel MODEL_DEPLOYMENT_NAME eller slutpunkter för MCP i verktygslådan, kommer in i environment_variables-sektionen av agent.yaml eller SDK-create_version-anropet.
Paketera och testa din agent lokalt
Innan du distribuerar till Foundry kontrollerar du att agenten fungerar lokalt med hjälp av protokollbiblioteket. Containern hanterar samma slutpunkter lokalt som i produktion.
Testa svarprotokollet
POST http://localhost:8088/responses
Content-Type: application/json
{
"input": "Where is Seattle?",
"stream": false
}
Testa anropsprotokollet
POST http://localhost:8088/invocations
Content-Type: application/json
{
"message": "Hello!"
}
Distribuera med hjälp av Azure Developer CLI eller VS Code
AZURE Developer CLI (azd) och VS Code-tillägget automatiserar hela distributionslivscykeln. En stegvis genomgång finns i Snabbstart: Skapa och distribuera en värdbaserad agent.
Distribuera med hjälp av Python SDK
Använd SDK när du vill hantera agentdistributioner direkt från Python kod.
Ytterligare förutsättningar
En containeravbildning i Azure Container Registry
Container Registry Repository Writer eller AcrPush-rollen i containerregistret (för att skicka avbildningar)
Azure AI Projects SDK version 2.1.0 eller senare
pip install "azure-ai-projects>=2.1.0"
Skapa och push-överföra containeravbildningen
Skapa docker-avbildningen:
docker build --platform linux/amd64 -t myagent:v1 .Push-överför till Azure Container Registry:
az acr login --name myregistry docker tag myagent:v1 myregistry.azurecr.io/myagent:v1 docker push myregistry.azurecr.io/myagent:v1
Tips
Använd unika avbildningstaggar istället för :latest i reproducerbara distribueringar.
Konfigurera behörigheter för containerregister
Ge projektets hanterade identitet åtkomst för att hämta bilder:
I Azure-portalen går du till din Foundry-projektresurs.
Välj Identitet och kopiera objekt-ID (huvudnamn) under Systemtilldelad.
Tilldela rollen Container Registry Repository Reader till den här identiteten i containerregistret. Se Azure Container Registry roller och behörigheter.
Skapa en värdbaserad agentversion
När du skapar en version initierar plattformen att tillhandahålla agenten automatiskt. Det finns inget separat startsteg – plattformen skapar en ögonblicksbild av containern och gör agenten redo att hantera begäranden.
from azure.ai.projects import AIProjectClient
from azure.ai.projects.models import HostedAgentDefinition, ProtocolVersionRecord, AgentProtocol
from azure.identity import DefaultAzureCredential
# Format: "https://resource_name.services.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"
# Create project client
credential = DefaultAzureCredential()
project = AIProjectClient(
endpoint=PROJECT_ENDPOINT,
credential=credential,
allow_preview=True,
)
# Create a hosted agent version
agent = project.agents.create_version(
agent_name="my-agent",
definition=HostedAgentDefinition(
container_protocol_versions=[
ProtocolVersionRecord(protocol=AgentProtocol.RESPONSES, version="1.0.0")
],
cpu="1",
memory="2Gi",
image="your-registry.azurecr.io/your-image:tag",
environment_variables={
"MODEL_DEPLOYMENT_NAME": "gpt-5-mini"
}
)
)
print(f"Agent created: {agent.name}, version: {agent.version}")
Om du vill exponera båda protokollen skickar du båda i container_protocol_versions:
container_protocol_versions=[
ProtocolVersionRecord(protocol=AgentProtocol.RESPONSES, version="1.0.0"),
ProtocolVersionRecord(protocol=AgentProtocol.INVOCATIONS, version="1.0.0")
],
Nyckelparametrar:
| Parameter | Beskrivning |
|---|---|
agent_name |
Unikt namn (alfanumeriskt med bindestreck, högst 63 tecken) |
image |
Fullständig URL för Azure Container Registry-avbild med tagg |
cpu |
CPU-allokering (till exempel "1") |
memory |
Minnesallokering (till exempel "2Gi") |
container_protocol_versions |
Protokoll som containern exponerar (responses, invocationseller båda) |
Sök efter versionsstatus
När du har skapat en version, kontrollera regelbundet tills statusen är active innan du anropar agenten. Konfigureringen tar vanligtvis mindre än en minut beroende på bildstorleken.
import time
# Poll until the agent version is active
while True:
version_info = project.agents.get_version(
agent_name="my-agent",
agent_version=agent.version
)
status = version_info["status"]
print(f"Status: {status}")
if status == "active":
print("Agent is ready!")
break
elif status == "failed":
print(f"Provisioning failed: {version_info['error']}")
break
time.sleep(5)
Versionsstatusvärden:
| Status | Beskrivning |
|---|---|
creating |
Infrastrukturetablering pågår |
active |
Agenten är redo att hantera begäranden |
failed |
Provisioneringen misslyckades – kontrollera fältet error för detaljer |
deleting |
Versionen håller på att rensas upp |
deleted |
Versionen har tagits bort helt |
Anropa agenten
När versionen har nått active status använder du get_openai_client för att skapa en OpenAI-klient som är bunden till agentens slutpunkt.
För protokollet Svar :
# Create an OpenAI client bound to the agent endpoint
openai_client = project.get_openai_client(agent_name="my-agent")
response = openai_client.responses.create(
input="Hello! What can you do?",
)
print(response.output_text)
För protokollet Anrop anropar du slutpunkten för anrop direkt:
import requests
token = credential.get_token("https://ai.azure.com/.default").token
url = f"{PROJECT_ENDPOINT}/agents/my-agent/endpoint/protocols/invocations"
response = requests.post(url, headers={
"Authorization": f"Bearer {token}",
"Content-Type": "application/json",
"Foundry-Features": "HostedAgents=V1Preview"
}, params={"api-version": "v1"}, json={
"message": "Process this task"
})
print(response.json())
För mer fullständiga exempel, se exemplen på värdbaserade agenter.
Distribuera med REST API:et
Använd REST-API:et för direkta HTTP-baserade distributioner eller när du integrerar med anpassade verktyg.
Innan du börjar skapar och skickar din containerbild och konfigurerar behörigheter för containerregistret.
Konfigurera variabler
BASE_URL="https://{account}.services.ai.azure.com/api/projects/{project}"
API_VERSION="v1"
TOKEN=$(az account get-access-token --resource https://ai.azure.com --query accessToken -o tsv)
Skapa en agent
curl -X POST "$BASE_URL/agents?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"name": "my-agent",
"definition": {
"kind": "hosted",
"image": "myacr.azurecr.io/my-agent:v1",
"cpu": "1",
"memory": "2Gi",
"container_protocol_versions": [
{"protocol": "responses", "version": "1.0.0"}
],
"environment_variables": {
"MODEL_DEPLOYMENT_NAME": "gpt-5-mini"
}
}
}'
När du skapar en agent skapas även version 1 och provisionering initieras.
Sök efter versionsstatus
Kontrollera versionsslutpunkten tills status är active:
while true; do
STATUS=$(curl -s -X GET "$BASE_URL/agents/my-agent/versions/1?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN" | jq -r '.status')
echo "Status: $STATUS"
[ "$STATUS" = "active" ] && echo "Ready!" && break
[ "$STATUS" = "failed" ] && echo "Provisioning failed." && exit 1
sleep 5
done
Anropa agenten
Använd agentens dedikerade slutpunkt för att skicka begäranden. Ange "stream": true för att ta emot server-skickade händelser.
Svarsprotokoll:
curl -X POST "$BASE_URL/agents/my-agent/endpoint/protocols/openai/responses?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"input": "Hello! What can you do?",
"store": true
}'
Anropsprotokoll:
curl -X POST "$BASE_URL/agents/my-agent/endpoint/protocols/invocations?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-H "Foundry-Features: HostedAgents=V1Preview" \
-d '{
"message": "Process this task"
}'
Skapa en ny version
Distribuera uppdaterad kod eller konfiguration genom att skapa en ny version:
curl -X POST "$BASE_URL/agents/my-agent/versions?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN" \
-H "Content-Type: application/json" \
-d '{
"definition": {
"kind": "hosted",
"image": "myacr.azurecr.io/my-agent:v2",
"cpu": "1",
"memory": "2Gi",
"container_protocol_versions": [
{"protocol": "responses", "version": "1.0.0"}
],
"environment_variables": {
"MODEL_DEPLOYMENT_NAME": "gpt-5-mini"
}
}
}'
Rensa resurser
Rensa resurser när du är klar för att förhindra avgifter. Agentens resurser frigörs efter 15 minuters inaktivitet, så det kostar ingenting när en agent inte hanterar förfrågningar.
Azure CLI-rensning för utvecklare
azd down
SDK-rensning
Ta bort en enskild version:
project.agents.delete_version(agent_name="my-agent", agent_version=agent.version)
Eller ta bort hela agenten och alla dess versioner:
project.agents.delete(agent_name="my-agent")
REST API-rensning
Ta bort en enskild version:
curl -X DELETE "$BASE_URL/agents/my-agent/versions/1?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN"
Eller ta bort hela agenten:
curl -X DELETE "$BASE_URL/agents/my-agent?api-version=$API_VERSION" \
-H "Authorization: Bearer $TOKEN"
Varning
Om du tar bort en agent tas alla dess versioner bort och aktiva sessioner avslutas. Det går inte att ångra den här åtgärden.
Felsökning
Etableringsfel visas på versionsobjektets error.code och error.message-fältet. Kontrollera versionsstatusen när du har skapat den för att identifiera problem.
| Felkod | HTTP-kod | Lösning |
|---|---|---|
image_pull_failed |
400 | Kontrollera att avbildnings-URI:n är korrekt och att projekthanterad identitet har Container Registry Repository Reader på ACR |
SubscriptionIsNotRegistered |
400 | Registrera prenumerationsprovidern |
InvalidAcrPullCredentials |
401 | Åtgärda hanterad identitet eller registeret-RBAC |
UnauthorizedAcrPull |
403 | Ange rätt autentiseringsuppgifter eller identitet |
AcrImageNotFound |
404 | Korrigera bildnamn/tagg eller publicera bild |
RegistryNotFound |
400/404 | Åtgärda register-DNS eller nätverkstillgänglighet |
Kontakta supporten för Microsoft för 5xx-fel.
Detaljerade RBAC-krav och behörighetsfelsökning finns i Referens för värdbaserade agentbehörigheter.