För att omvandla tabelldata med Data Prep connector måste du först ställa in den sekvens - eller pipeline- av omvandlingar som ska tillämpas. En pipeline ger en grafisk representation av dess definierade transformationer och möjliggör förhandsgranskning av varje transformations påverkan.
Tips: Om dina kedjor använder en gemensam sekvens av Tabular Transformation och File Utilities kommandon för att uppdatera data från dina system för post, skapa pipelines för att utföra dessa omvandlingar med ett enda Kör pipeline kommando.
Krav och önskemål
Data Prep styrs helt på organisationsnivå och känner inte igen enskilda arbetsytor eller deras behörigheter.
Det betyder..:
- Data Prep aktieägs av alla auktoriserade användare i din organisation.
- Alla användare med åtkomst till Chain Builder har också åtkomst till Data Prep.
- Alla användare som kan skapa eller redigera kedjor kommer att ha möjlighet att hantera pipelines i Data Prep.
- En enda Data Prep-pipeline kan användas i flera kedjor och arbetsytor inom en organisation.
Steg 1. Skapa pipelinen
Tips: Innan du skapar pipelinen, från Sample files, ladda upp en provfil som representerar kolumnerna och data som den ska omvandla för att enkelt definiera pipelinens kolumner och möjliggöra en förhandsgranskning av de omvandlingar som tillämpas.
- I Wdata klickar du på Chains och Data Prep.
Obs: För åtkomst till Data Prep från Wdata Chains, måste du först konfigurera en Data Prep anslutning.
- Från Pipelines , under Active pipelines, skapa pipelinen:
- För den första pipelinen klickar du på Skapa en pipeline.
- Annars klickar du på Ny pipeline ( ) bredvid sökfältet.
- Ange ett namn och en beskrivning som hjälper till att identifiera pipelinen.
- Klicka på Skapa.
Steg 2. Definiera kolumnerna
För att ange vilka fält som pipelinen ska interagera med måste du definiera kolumnerna i de data som ska omvandlas. När du definierar en kolumn anger du dess namn samt typ och format för dess data. För en kolumn med datatypen Number anger du till exempel dess decimaler och de tecken som används för decimal- och tusentalsavgränsare.
Observera: De kolumnnamn som definieras för pipelinen kan skilja sig från kolumnerna i de data som den omvandlar.
För att definiera pipelines kolumner kan du använda kolumndefinitionen från en uppladdad fil med prov eller en avgränsad fil som sparats lokalt eller på ditt nätverk. Du kan också definiera kolumner manuellt.
För att underlätta skapandet av pipeline rekommenderar vi att du använder ett prov för att definiera kolumnerna:
Obs: Om du vill använda en provfil måste du först ladda upp den till Provfiler.
- Under Definiera kolumner, klicka på Välj från listan.
- Välj provfilen med den kolumndefinition som ska användas och klicka på OK.
Obs: Kolumndefinitionen för provfilen kommer att ersätta alla kolumner som definierats för pipelinen.
- Granska kolumndefinitionen och redigera kolumnernas namn vid behov.
- Klicka på Spara.
För att definiera pipelines kolumner kan du ladda upp en fil med samma kolumndefinition.
Obs: Filen måste vara avgränsad och innehålla en rad med rubrik.
- Under Definiera kolumner klickar du på Skapa från filen.
- Bläddra till och markera filen med den kolumndefinition som ska användas och klicka på OK.
Obs: Filens kolumndefinition kommer att ersätta alla kolumner som definierats för pipelinen.
- Granska kolumndefinitionen och redigera kolumnernas namn och datatyper vid behov.
Obs: Se till att granska och uppdatera kolumndefinitionen. Pipelinen använder kolumnnamn från filens rubrik och gissar datatyper baserat på data.
- Klicka på Spara.
För att manuellt definiera en kolumn:
- Under Definiera kolumner klickar du på Lägg till kolumner.
- Välj kolumnens datatyp.
- Ange ett namn och en beskrivning som hjälper till att identifiera kolumnen.
- Ange formatet för kolumnens data, baserat på dess typ:
- För kolumnen String väljer du ett specialformat, t.ex. för UUID (universally unique identifier), binära strängar, e-postadresser eller URI (uniform resource identifier) webbadresser.
- För en kolumn Integer väljer du tusentalsavgränsaren.
- För en kolumn Number anger du antalet decimaler och väljer decimal- och tusentalavgränsare.
- För en Datum, Tid, eller Datumtid kolumn, välj dess strängfrån-tid (strftime) format.
Obs: En Binär kolumn innehåller värden som sant eller falskt, eller 1 eller 0.
- När du har definierat alla kolumner klickar du på Spara.
Steg 3. Ställ in omvandlingarna
- För att få en förhandsgranskning av omvandlingarnas inverkan, pin en provfil som indikerar de kolumner och data som ska omvandlas av pipelinen.
- Klicka på Skapa omvandling.
- Välj den transformation som ska tillämpas, och klicka på Nästa.
- Ställ in omvandlingen och klicka på Spara.
- För att ställa in ytterligare omvandlingar klickar du på Lägg till omvandling före eller efter den befintliga omvandlingen, baserat på när den ska ske.
Tips: Om du vill lägga till en annan instans av en transformation som redan finns i pipelinen klickar du på Kopiera och konfigurerar den nya instansen enligt behov.
- Justera transformationerna efter behov:
- Om du vill flytta en transformation i pipelinen klickar du på Flytta framåt eller Flytta bakåt.
- För att ta bort en transformation från pipelinen klickar du på dess Ta bort.
Obs: Om du flyttar eller tar bort en transformation, justera alla transformationer som är beroende av dess resultat efter behov.
Steg 4. Publicera pipelinen
När pipelinen är klar att användas klickar du på Publicera.
När du har publicerat pipelinen kan du använda den med kommandot Kör pipeline av Data Prep kontakten för att tillämpa dess omvandlingar på tabelldata inom en kedja.