Dopo aver creato una pipeline, puoi gestirne i dettagli, la definizione delle colonne e le trasformazioni come necessario.
Requisiti
Data Prep è controllato interamente a livello di organizzazione e non riconosce gli spazi di lavoro individuali o i loro permessi.
Questo significa che:
- Data Prep è condiviso da tutti gli utenti autorizzati della tua organizzazione.
- Tutti gli utenti che hanno accesso a Chain Builder hanno accesso anche a Data Prep.
- Tutti gli utenti che possono creare o modificare le catene avranno la possibilità di gestire le pipeline in Data Prep.
- Una singola pipeline di Data Prep può essere utilizzata in più catene e spazi di lavoro all'interno di un'organizzazione.
Modifica della definizione di colonna di una pipeline
Puoi aggiornare il nome, il tipo di dati o il formato della colonna di una pipeline in qualsiasi momento. Quando definisci una colonna di una pipeline, seleziona il tipo di dati che contiene:
| Tipo di dati | Descrizione | Valori di esempio |
|---|---|---|
| Stringa | Una sequenza di caratteri alfanumerici | California, 400010 |
| Numero intero | Un numero intero, con o senza separatore delle migliaia | 25, 37450 |
| Numero | Un numero che include un decimale, con o senza il separatore delle migliaia | 15.75, 37865.95, 25,789.62 |
| Booleano | Un valore vero o falso | Vero o 1, Falso o 0 |
| Data | Una data con giorno, mese e anno | 1/1/2021, 2021-01-01 |
| Ora | Un'ora del giorno | 14:37, 09:52:10 |
| DateTime | Una data e un timestamp | 2021-01-01T18:26:33 |
Puoi definire le colonne di una pipeline manualmente oppure utilizzare la definizione di colonna di un file di esempio o di un file caricato.
Per facilitare la creazione della pipeline, ti consigliamo di utilizzare un file campione per definire le sue colonne:
Nota: Per utilizzare un file campione, prima caricalo su File campione.
- Da Wdata Chains, clicca su Data Prep.
- Da Pipelines , apri la pipeline.
- Nella scheda Colonne , clicca su Modifica colonne.
- In Definisci colonne, clicca su Scegli dall'elenco.
- Seleziona il file campione con la definizione di colonna da utilizzare e clicca su OK.
Nota: La definizione di colonna del file campione sostituirà tutte le colonne definite per la pipeline.
- Esamina la definizione delle colonne e modifica i nomi delle colonne se necessario.
- Clicca su Salva.
Per definire le colonne della pipeline, puoi caricare un file con la stessa definizione di colonna.
Nota: Il file deve essere delimitato e contenere una riga di intestazione.
- Da Wdata Chains, clicca su Data Prep.
- Da Pipelines , apri la pipeline.
- Nella scheda Colonne , clicca su Modifica colonne.
- In Definisci colonne, clicca su Crea da file.
- Cerca e seleziona il file con la definizione di colonna da utilizzare e clicca su OK.
Nota: La definizione di colonna del file sostituirà tutte le colonne definite per la pipeline.
- Esamina la definizione delle colonne e modifica i nomi e i tipi di dati delle colonne se necessario.
Nota: Assicurati di rivedere e aggiornare la definizione della colonna. La pipeline utilizza i nomi delle colonne dalla riga di intestazione del file e ipotizza i tipi di dati in base ai dati.
- Clicca su Salva.
Per definire manualmente una colonna:
- Da Wdata Chains, clicca su Data Prep.
- Da Pipelines , apri la pipeline.
- Nella scheda Colonne , clicca su Modifica colonne.
- In Definisci colonne, clicca su Aggiungi colonne.
- Seleziona il tipo di dati della colonna.
- Inserisci un nome e una descrizione per identificare la colonna.
- Specifica il formato dei dati della colonna, in base al suo tipo:
- Per una colonna Stringa, seleziona qualsiasi formato speciale, come ad esempio gli identificatori universalmente unici (UUID), le stringhe binarie, gli indirizzi e-mail o gli indirizzi web URI (uniform resource identifier).
- Per una colonna Numero intero, seleziona il separatore delle migliaia.
- Per una colonna Numero, inserisci il numero di decimali e seleziona i separatori dei decimali e delle migliaia.
- Per una colonna Data, Ora o DataOra, seleziona il formato string-from-time (strftime).
Nota: Una colonna binaria contiene valori quali True o False, oppure 1 o 0.
- Dopo aver definito tutte le colonne, clicca su Salva.
Copia una pipeline
Per creare rapidamente una nuova pipeline con colonne o trasformazioni simili a quelle di un'altra pipeline, inizia con una copia della pipeline esistente:
- Da Pipeline , clicca su Copia per la pipeline esistente.
- Per rinominare la nuova pipeline, modifica il suo nome e clicca su OK.
- Modifica la definizione della colonna o le trasformazioni come necessario.
- Clicca su Pubblica.
Archiviare una pipeline
Se non usi più una pipeline, puoi archiviarla in modo che non sia più attiva:
- Da Pipeline , nella scheda Active, clicca su Archive per la pipeline.
- Dalla pipeline, seleziona Archivia dal suo menu.
Nota: Per riportare una pipeline archiviata allo stato attivo, da Pipelines, seleziona la scheda Archived e clicca su Unarchive per la pipeline.
Cancellare una pipeline
Per rimuovere completamente una pipeline, puoi eliminarla.
Nota: A differenza di una pipeline archiviata, non puoi ripristinare una pipeline cancellata. Elimina una pipeline solo se non ne hai più bisogno.
- Da Pipeline , archivia la pipeline se è attiva.
- Nella scheda Archiviati, clicca su Elimina per la pipeline.
- In Conferma, inserisci
elimina. - Clicca su Elimina.