Introduction

Slutförd

Datorsyn är ett område inom AI som gör det möjligt för datorer att tolka och förstå visuell information från världen, till exempel bilder, videor och livekameraflöden. Funktioner för datorseende drivs av AI-modeller och stöder automatisering av alla typer av tidsintensiva uppgifter.

I den här modulen beskrivs AI-modeller som kan identifiera och analysera objekt, identifiera mönster, läsa text i bilder och tolka scener ungefär som en människa skulle göra. Modulen omfattar även visuella AI-modeller som kan gå utöver bildanalys för att generera nytt visuellt innehåll. Tillsammans möjliggör dessa funktioner en mängd olika program, från bildsökning och dokumentanalys, till kreativa verktyg och interaktiva AI-upplevelser, genom att låta system både se och skapa visuell information.

Tänk på dessa tillämpningar av datorseende:

  • Defekt identifiering i tillverkning: AI-visionssystem inspekterar produkter på monteringslinjer i realtid. De upptäcker ytfel, feljusteringar eller komponenter som saknas med hjälp av objektidentifiering och bildsegmentering, vilket minskar avfallet och förbättrar kvalitetskontroll.

  • Medicinsk bildanalys: Datorseende hjälper radiologer att analysera röntgenbilder, MR och CT. AI-modeller kan belysa avvikelser som tumörer eller frakturer, hjälpa till med tidig diagnos och minska mänskliga fel.

  • Hyllövervakning i detaljhandeln: Återförsäljare använder AI-vision för att övervaka butikshyllor. Kameror identifierar när produkter är slut i lager eller felplacerade, vilket möjliggör lageruppdateringar i realtid och förbättrar kundupplevelsen.

  • Självkörande fordon: Självkörande bilar förlitar sig på visuellt innehåll för att känna igen vägskyltar, körfältsmarkeringar, fotgängare och andra fordon. Detta möjliggör säker navigering och beslutsfattande i dynamiska miljöer.

Utforska sedan multimodala modeller i Microsoft Foundry, Microsofts enhetliga plattform som en tjänst-erbjudande på Azure för företags-AI-åtgärder och programutveckling.

Anmärkning

Vi inser att olika personer gillar att lära sig på olika sätt. Du kan välja att slutföra den här modulen i videobaserat format eller läsa innehållet som text och bilder. Texten innehåller mer detaljer än videorna, så i vissa fall kanske du vill referera till den som kompletterande material till videopresentationen.