Bemærk
Adgang til denne side kræver godkendelse. Du kan prøve at logge på eller ændre mapper.
Adgang til denne side kræver godkendelse. Du kan prøve at ændre mapper.
XML (Extensible Markup Language) er et tekstbaseret format til struktureret dataudveksling. Denne artikel skitserer, hvordan man konfigurerer XML-format som kilde i en copy activity pipeline i Data Factory i Microsoft Fabric.
Understøttede funktioner
XML-format understøttes for følgende aktiviteter og forbindelser som kilde.
| Kategori | Connector/aktivitet |
|---|---|
| Understøttet connector | Amazon S3 |
| Amazon S3-kompatibel | |
| Azure Blob Storage | |
| Azure Data Lake Storage Gen2 | |
| Azure Files | |
| Filsystem | |
| FTP | |
| Google Cloud Storage | |
| HTTP | |
| Lakehouse-filer | |
| Oracle Cloud Storage | |
| SFTP | |
| Understøttet aktivitet | Kopiér aktivitet (kilde/-) |
| Opslagsaktivitet | |
| GetMetadata-aktivitet | |
| Slet aktivitet |
XML-format i kopiaktivitet
Hvis du vil konfigurere XML-format, skal du vælge din forbindelse i kilden til en pipelinekopieringsaktivitet og derefter vælge XML på rullelisten over Filformat. Vælg Indstillinger for yderligere konfiguration af dette format.
XML som kilde
Når du har valgt Indstillinger i afsnittet Filformat, vises følgende egenskaber i dialogboksen Indstillinger for pop op-filformat.
Komprimeringstype: Den komprimeringscodec, der bruges til at læse XML-filer. Du kan vælge mellem Ingen, bzip2, gzip, deflate, ZipDeflate, TarGZip eller tjæretype på rullelisten.
Hvis du vælger ZipDeflate som komprimeringstype, vises Bevar zip-filnavnet som mappe under Avancerede indstillinger under fanen Kilde.
-
Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til
<specified file path>/<folder named as source zip file>/. - Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten ikke-pakkede filer direkte til
<specified file path>. Sørg for, at du ikke har duplikerede filnavne i forskellige kilde zip-filer for at undgå væddeløb eller uventet funktionsmåde.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten ikke-udpakkede filer til
Hvis du vælger TarGZip/tar som komprimeringstype, vises Bevar komprimeringsfilnavnet som mappe under avancerede indstillinger under fanen Kilde.
-
Bevar komprimeringsfilnavnet som mappe: Angiver, om det komprimerede kildefilnavn skal bevares som en mappestruktur under kopiering.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til
<specified file path>/<folder named as source compressed file>/. - Hvis afkrydsningsfeltet ikke er markeret, skriver tjenesten dekomprimerede filer direkte til
<specified file path>. Sørg for, at du ikke har duplikerede filnavne i forskellige kildefiler for at undgå væddeløb eller uventet funktionsmåde.
- Hvis dette afkrydsningsfelt er markeret (standard), skriver tjenesten dekomprimerede filer til
-
Bevar zip-filnavnet som mappe: Angiver, om kilde-zip-filnavnet skal bevares som en mappestruktur under kopien.
Komprimeringsniveau: Angiv komprimeringsforholdet, når du vælger en komprimeringstype. Du kan vælge mellem Hurtigste eller Optimal.
- Hurtigst: Komprimeringshandlingen skal fuldføres så hurtigt som muligt, selvom den resulterende fil ikke komprimeres optimalt.
- Optimal: Komprimeringshandlingen skal komprimeres optimalt, selvom handlingen tager længere tid at fuldføre. Du kan få flere oplysninger under Emnet Komprimeringsniveau.
Kodning: Angiv den kodningstype, der bruges til at læse tekstfiler. Vælg én type på rullelisten. Standardværdien er UTF-8.
Null-værdi: Angiver strengrepræsentationen af null-værdien. Standardværdien er en tom streng.
Under Avancerede indstillinger under fanen Kilde vises følgende egenskaber for XML-format.
Valideringstilstand: Angiver, om XML-skemaet skal valideres. Vælg én tilstand på rullelisten.
- Ingen: Vælg dette for ikke at bruge valideringstilstand.
- xsd: Vælg dette for at validere XML-skemaet ved hjælp af XSD.
- dtd: Vælg dette for at validere XML-skemaet ved hjælp af DTD.
Navneområder: Angiv, om navneområdet skal aktiveres, når XML-filerne fortolkes. Den er valgt som standard.
Præfikspar for navneområde: Hvis navneområder er aktiveret, skal du vælge + Ny og angive URL-adressen og præfikset. Du kan tilføje flere par ved at vælge + Ny.
URI for navneområde til præfikstilknytning bruges til at navngive felter, når XML-filen fortolkes. Hvis en XML-fil har navneområde, og navneområdet er aktiveret, er feltnavnet som standard det samme som i XML-dokumentet. Hvis der er defineret et element for navneområde-URI'en i denne tilknytning, erprefix:fieldNamefeltnavnet .
Registrer datatype: Angiv, om der skal registreres heltals-, dobbelt- og booleske datatyper. Den er valgt som standard.
XML-kopieringsaktivitetsegenskaber
XML som kilde
Følgende egenskaber understøttes i afsnittet kopiaktivitetskilde, når du bruger XML-format.
| Navn | Beskrivelse | Værdi | Kræves | JSON-scriptegenskab |
|---|---|---|---|---|
| Filformat | Det filformat, du vil bruge. | XML | Ja | type (under datasetSettings):Xml |
| Komprimeringstype | Den komprimeringscodec, der bruges til at læse XML-filer. |
Ingen bzip2 gzip Deflatere ZipDeflate TarGZip tjære |
Nr. | type (under compression): bzip2 gzip Deflatere ZipDeflate TarGZip tjære |
| Komprimeringsniveau | Komprimeringsforholdet. |
Hurtigste Optimal |
Nej | niveau (under compression): Hurtigste Optimal |
| Kodning | Den kodningstype, der bruges til at læse tekstfiler. | "UTF-8" (som standard),"UTF-8 without BOM", "UTF-16LE", "UTF-16BE", "UTF-32LE", "UTF-32BE", "US-ASCII", "UTF-7", "BIG5", "EUC-JP", "EUC-KR", "GB2312", "GB18030", "JOHAB", "SHIFT-JIS", "CP875", "CP866", "IBM00858", "IBM037", "IBM273", "IBM437", "IBM500", "IBM737", "IBM775", "IBM850", "IBM852", "IBM855", "IBM857", "IBM860", "IBM861", "IBM863", "IBM864", "IBM865", "IBM865", "IBM 869", "IBM870", "IBM01140", "IBM01141", "IBM01142", "IBM01143", "IBM01144", "IBM01145", "IBM01146", "IBM01147", "IBM01148", "IBM01149", "ISO-2022-JP", "ISO-2022-KR", "ISO-8859-1", "ISO-8859-2", "ISO-8859-3", "ISO-8859-4", "ISO-8859-5", "ISO-8859-6", "ISO-8859-7", "ISO-8859-8", "ISO-8859-9", "ISO-8859-13", "ISO-8859-15", "WINDOWS-874", "WINDOWS-1250", "WINDOWS-1251", "WINDOWS-125 2", "WINDOWS-1253", "WINDOWS-1254", "WINDOWS-1255", "WINDOWS-1256", "WINDOWS-1257", "WINDOWS-1258" | Nej | encodingName |
| Bevar zip-filnavnet som mappe | Angiver, om zip-kildefilnavnet skal bevares som en mappestruktur under kopiering. | Markeret (standard) eller fravælg | Nr. | preserveZipFileNameAsFolder (under compressionProperties->type som ZipDeflateReadSettings):true (standard) eller false |
| Bevar komprimering af filnavnet som mappe | Angiver, om kildens komprimerede filnavn skal bevares som en mappestruktur under kopiering. | Markeret (standard) eller fravælg | Nr. | preserveCompressionFileNameAsFolder (under compressionProperties->type som TarGZipReadSettings eller TarReadSettings):true (standard) eller false |
| Null-værdi | Strengrepræsentationen af null-værdien. |
<din null-værdi> tom streng (som standard) |
Nej | nullValue |
| Valideringstilstand | Angiver, om XML-skemaet skal valideres. |
Ingen xsd Dtd |
Nr. | validationMode: xsd Dtd |
| Navneområder | Angiver, om navneområdet skal aktiveres, når XML-filerne fortolkes. | Markeret (standard) eller ikke markeret | Nr. | navneområder: true (standard) eller false |
| Præfikspar for navneområde | URI for navneområde til præfikstilknytning, som bruges til at navngive felter, når XML-filen fortolkes. Hvis en XML-fil har navneområde, og navneområdet er aktiveret, er feltnavnet som standard det samme som i XML-dokumentet. Hvis der er defineret et element for navneområde-URI'en i denne tilknytning, er prefix:fieldNamefeltnavnet . |
< url >:< præfiks > | Nr. | namespacePrefixes: < url >:< præfiks > |
| Registrer datatype | Angiver, om der skal registreres heltals-, dobbelt- og booleske datatyper. | Markeret (standard) eller ikke markeret | Nr. | detectDataType: true (standard) eller false |