Den här webbläsaren stöds inte längre.
Uppgradera till Microsoft Edge och dra nytta av de senaste funktionerna och säkerhetsuppdateringarna, samt teknisk support.
Vad är en multimodal modell?
En modell som bara kan bearbeta bilder men inte text.
En modell som kan förstå och arbeta med mer än en typ av data, till exempel text och bilder.
En modell som endast genererar videoinnehåll.
Hur kan utvecklare programmatiskt generera bilder med hjälp av Foundry-bildgenereringsmodeller?
Genom att skicka textprompter via OpenAI-svars-API:et med hjälp av en distribuerad avbildningsmodell
Genom att ladda upp bilder via Foundry Playground-användargränssnittet.
Genom att anropa GPT-4.1-modellslutpunkten.
Vilket värde ska du ange som modellparameter i begäran när du genererar bilder programmatiskt med hjälp av OpenAI Python SDK och Microsoft Foundry?
Det ursprungliga basmodellnamnet (till exempel gpt-image-1.5).
Distribueringsnamnet du gav till bildgenereringsmodellen i din Foundry-resurs.
Namnet du gav din Foundry-resurs.
Varför hanteras videogenerering med Sora-modeller i Microsoft Foundry som ett asynkront jobb?
Eftersom videogenerering kräver användarinteraktion under återgivningen.
Eftersom REST-API:et inte stöder synkrona begäranden.
Eftersom videogenereringen är resursintensiv och tar tid att slutföra.
Du måste svara på alla frågor innan du kontrollerar ditt arbete.
Var den här sidan till hjälp?
Behöver du hjälp med det här ämnet?
Vill du prova att använda Fråga Lär för att klargöra eller vägleda dig genom det här ämnet?