Per trasformare i dati tabellari con il connettore Data Prep, devi prima impostare la sequenza (o pipeline) di trasformazioni da applicare. Una pipeline fornisce una rappresentazione grafica delle trasformazioni definite e consente di visualizzare un'anteprima dell'impatto di ciascuna trasformazione.
Suggerimento: Se le tue catene utilizzano una sequenza comune di comandi Trasformazione tabellare e Utilità file per aggiornare i dati dai tuoi sistemi di record, crea delle pipeline per eseguire queste trasformazioni con un singolo comando Esegui pipeline.
Requisiti
Data Prep è controllato interamente a livello di organizzazione e non riconosce gli spazi di lavoro individuali o i loro permessi.
Questo significa che:
- Data Prep è condiviso da tutti gli utenti autorizzati della tua organizzazione.
- Tutti gli utenti che hanno accesso a Chain Builder hanno accesso anche a Data Prep.
- Tutti gli utenti che possono creare o modificare le catene avranno la possibilità di gestire le pipeline in Data Prep.
- Una singola pipeline di Data Prep può essere utilizzata in più catene e spazi di lavoro all'interno di un'organizzazione.
Passo 1. Crea la pipeline
Suggerimento: Prima di creare la pipeline, da File campione, carica un file campione che rappresenta le colonne e i dati che verranno trasformati per definire facilmente le colonne della pipeline e consentire di visualizzare un'anteprima delle trasformazioni applicate.
- In Wdata, clicca su Catene e Data Prep.
Nota: Per accedere a Data Prep da Catene Wdata, prima impostare un connettore Data Prep.
- Da Pipeline , in Pipeline attive, crea la pipeline:
- Per la prima pipeline, clicca su Crea una pipeline.
- Altrimenti, clicca su Nuova pipeline (+) accanto alla barra di ricerca.
- Inserisci un nome e una descrizione per identificare meglio la pipeline.
- Clicca su Crea.
Passo 2. Definire le colonne
Per specificare i campi con cui la pipeline interagirà, definisci le colonne dei dati che trasforma. Quando definisci una colonna, specifichi il suo nome e il tipo e il formato dei suoi dati. Ad esempio, per una colonna con tipo di dati Numero, specifica le cifre decimali e i caratteri utilizzati per i separatori decimali e delle migliaia.
Nota: I nomi delle colonne definiti per la pipeline possono differire dalle colonne dei dati che trasforma.
Per definire le colonne della pipeline, puoi utilizzare la definizione di colonna di un file di esempio caricato o un delimitato file salvato localmente o in rete. Puoi anche definire manualmente le colonne.
Per facilitare la creazione della pipeline, ti consigliamo di utilizzare un file campione per definire le sue colonne:
Nota: Per utilizzare un file campione, prima caricalo su File campione.
- In Definisci colonne, clicca su Scegli dall'elenco.
- Seleziona il file campione con la definizione di colonna da utilizzare e clicca su OK.
Nota: La definizione di colonna del file campione sostituirà tutte le colonne definite per la pipeline.
- Esamina la definizione delle colonne e modifica i nomi delle colonne se necessario.
- Clicca su Salva.
Per definire le colonne della pipeline, puoi caricare un file con la stessa definizione di colonna.
Nota: Il file deve essere delimitato e contenere una riga di intestazione.
- In Definisci colonne, clicca su Crea da file.
- Cerca e seleziona il file con la definizione di colonna da utilizzare e clicca su OK.
Nota: La definizione di colonna del file sostituirà tutte le colonne definite per la pipeline.
- Esamina la definizione delle colonne e modifica i nomi e i tipi di dati delle colonne se necessario.
Nota: Assicurati di rivedere e aggiornare la definizione della colonna. La pipeline utilizza i nomi delle colonne dalla riga di intestazione del file e ipotizza i tipi di dati in base ai dati.
- Clicca su Salva.
Per definire manualmente una colonna:
- In Definisci colonne, clicca su Aggiungi colonne.
- Seleziona il tipo di dati della colonna.
- Inserisci un nome e una descrizione per identificare la colonna.
- Specifica il formato dei dati della colonna, in base al suo tipo:
- Per una colonna Stringa, seleziona qualsiasi formato speciale, come ad esempio gli identificatori universalmente unici (UUID), le stringhe binarie, gli indirizzi e-mail o gli indirizzi web URI (uniform resource identifier).
- Per una colonna Numero intero, seleziona il separatore delle migliaia.
- Per una colonna Numero, inserisci il numero di decimali e seleziona i separatori dei decimali e delle migliaia.
- Per una colonna Data, Ora o DataOra, seleziona il formato string-from-time (strftime).
Nota: Una colonna binaria contiene valori quali True o False, oppure 1 o 0.
- Dopo aver definito tutte le colonne, clicca su Salva.
Passo 3. Imposta le trasformazioni
- Per avere un'anteprima dell'impatto delle trasformazioni, indica un file campione indicativo delle colonne e dei dati che verranno trasformati dalla pipeline.
- Clicca su Crea trasformazione.
- Seleziona la trasformazione da applicare e clicca su Avanti.
- Imposta la trasformazione e clicca su Salva.
- Per impostare eventuali trasformazioni aggiuntive, clicca su Aggiungi trasformazione prima o dopo la trasformazione esistente, in base a quando deve avvenire.
Suggerimento: Per aggiungere un'altra istanza di una trasformazione già presente nella pipeline, clicca su Copia e imposta la nuova istanza come necessario.
- Regola le trasformazioni come necessario:
- Per riposizionare una trasformazione all'interno della pipeline, clicca su Sposta in avanti o Sposta indietro.
- Per rimuovere una trasformazione dalla pipeline, clicca su Elimina.
Nota: Se sposti o elimini una trasformazione, regola le trasformazioni che dipendono dal suo risultato secondo necessità.
Passo 4. Pubblicare la pipeline
Quando la pipeline è pronta per essere utilizzata, clicca su Pubblica.
Dopo aver pubblicato la pipeline, puoi usarla con il comando Esegui pipeline del connettore Data Prep per applicare le trasformazioni ai dati tabellari all'interno di una catena.