Nadat u een pijplijn hebt gemaakt, kunt u de details, kolomdefinitie en transformaties ervan beheren.
Vereisten
Data Prep wordt volledig op org-niveau beheerd en herkent geen individuele workspaces of hun machtigingen.
Dit betekent:
- Data Prep wordt gedeeld door alle geautoriseerde gebruikers in uw org.
- Elke gebruiker met toegang tot Chain Builder heeft ook toegang tot Data Prep.
- Alle gebruikers die ketens kunnen maken of bewerken, zullen de mogelijkheid hebben om pijplijnen in Data Prep te beheren.
- Eén enkele Data Prep pipeline kan in meerdere ketens en workspaces binnen een organisatie worden gebruikt.
De kolomdefinitie van een pijplijn bewerken
U kunt de naam, het gegevenstype of de opmaak van de kolom van een pijplijn op elk moment bijwerken. Wanneer u de kolom van een pijplijn definieert, selecteert u het gegevenstype dat het bevat:
| Gegevenstype | Beschrijving | Voorbeeldwaarden |
|---|---|---|
| String | Een reeks alfanumerieke tekens | Californië, 400010 |
| Geheel getal | Een geheel getal, met of zonder scheidingsteken tussen duizendtallen | 25, 37450 |
| Aantal | Een getal met decimalen, met of zonder duizendtallig scheidingsteken | 15.75, 37865.95, 25,789.62 |
| Booleaanse | Een waar of onwaar waarde | Waar of 1, Onwaar of 0 |
| Datum | Een datum met een dag, maand en jaar | 1/1/2021, 2021-01-01 |
| Tijd | Een moment van de dag | 14:37, 09:52:10 |
| DateTime | Een datum en tijdstempel | 2021-01-01T18:26:33 |
U kunt de kolommen van een pijplijn handmatig definiëren, of de kolomdefinitie van een voorbeeldbestand of bestandsupload gebruiken.
Om het aanmaken van een pijplijn te vergemakkelijken, raden wij u aan een voorbeeldbestand te gebruiken om de kolommen te definiëren:
Opmerking: Als u een voorbeeldbestand wilt gebruiken, moet u dit eerst uploaden naar Voorbeeldbestanden.
- Ga naar Wdata Ketens, klik op Data Prep.
- Vanaf Pipelines , opent u de pipeline.
- Klik op het tabblad Columns op Kolommen bewerken.
- Klik onder Kolommen definiëren op Kiezen uit lijst.
- Selecteer het voorbeeldbestand met de kolomdefinitie die u wilt gebruiken en klik op OK.
Opmerking: De kolomdefinitie van het voorbeeldbestand vervangt alle kolommen die voor de pijplijn zijn gedefinieerd.
- Bekijk de kolomdefinitie en bewerk de namen van de kolommen indien nodig.
- Klik op Opslaan.
Om de kolommen van de pijplijn te definiëren, kunt u een bestand met dezelfde kolomdefinitie uploaden.
Opmerking: Het bestand moet afgebakend zijn en een kopregel bevatten.
- Ga naar Wdata Ketens, klik op Data Prep.
- Vanaf Pipelines , opent u de pipeline.
- Klik op het tabblad Columns op Kolommen bewerken.
- Klik onder Kolommen definiëren op Maken vanuit bestand.
- Blader naar en selecteer het bestand met de kolomdefinitie die u wilt gebruiken, en klik op OK.
Opmerking: De kolomdefinitie van het bestand vervangt alle kolommen die voor de pijplijn zijn gedefinieerd.
- Bekijk de kolomdefinitie en bewerk indien nodig de namen en gegevenstypen van de kolommen.
Opmerking: Zorg ervoor dat u de kolomdefinitie controleert en bijwerkt. De pijplijn gebruikt kolomnamen uit de kopregel van het bestand en raadt gegevenstypes op basis van de gegevens.
- Klik op Opslaan.
Om handmatig een kolom te definiëren:
- Ga naar Wdata Ketens, klik op Data Prep.
- Vanaf Pipelines , opent u de pipeline.
- Klik op het tabblad Columns op Kolommen bewerken.
- Klik onder Kolommen definiëren op Kolommen toevoegen.
- Selecteer het gegevenstype van de kolom.
- Voer een naam en beschrijving in om de kolom te helpen identificeren.
- Specificeer het formaat van de gegevens van de kolom, gebaseerd op het type:
- Selecteer voor een kolom String een speciale indeling, zoals voor universally unique identifiers (UUID's), binaire strings, e-mailadressen of uniform resource identifier (URI) webadressen.
- Selecteer voor een kolom Integer het scheidingsteken voor duizendtallen.
- Voor een kolom Getal voert u het aantal decimalen in en selecteert u de decimale en duizendtallenscheidingstekens.
- Selecteer voor een Datum, Tijd, of DatumTijd kolom de indeling string-from-time (strftime).
Opmerking: Een Binaire kolom bevat waarden zoals Waar of Onwaar, of 1 of 0.
- Nadat u alle kolommen hebt gedefinieerd, klikt u op Opslaan.
Een pijplijn kopiëren
Om snel een nieuwe pijplijn te maken met dezelfde kolommen of transformaties als een andere pijplijn, begint u met een kopie van de bestaande pijplijn:
- Ga naar Pipelines , klik op Copy voor de bestaande pijplijn.
- Om de naam van de nieuwe pijplijn te wijzigen, bewerkt u de naam en klikt u op OK.
- Bewerk de kolomdefinitie of transformaties waar nodig.
- Klik op Publiceren.
Een pijplijn archiveren
Als u een pijplijn niet langer gebruikt, kunt u deze archiveren zodat deze niet langer actief is:
- Ga naar Pipelines , klik op het tabblad Active op Archive voor de pijplijn.
- Selecteer in de pijplijn Archief uit het menu.
Opmerking: Om een gearchiveerde pijplijn terug te zetten naar de status Actief, gaat u naar Pijplijnen, selecteert u het tabblad Gearchiveerd en klikt u op Unarchive voor de pijplijn.
Een pijplijn verwijderen
Om een pijplijn volledig te verwijderen, kunt u deze verwijderen.
Opmerking: In tegenstelling tot een gearchiveerde pijplijn, kunt u een verwijderde pijplijn niet herstellen. Verwijder een pijplijn alleen als u deze niet meer nodig hebt.
- Van Pipelines , archiveer de pipeline indien actief.
- Klik op het tabblad Gearchiveerd op voor de pijplijn.
- In bevestig, voer
in verwijder. - Klik op Verwijderen.