Om tabelgegevens te transformeren met de Data Prep connector, stelt u eerst de reeks of pijplijnin van de transformaties die u wilt toepassen. Een pijplijn biedt een grafische weergave van de gedefinieerde transformaties en maakt een voorbeeld van de impact van elke transformatie mogelijk.
Tip: Als uw ketens een gemeenschappelijke opeenvolging van Tabular Transformation en File Utilities opdrachten gebruiken om gegevens van uw recordsystemen bij te werken, maak dan pijplijnen om die transformaties uit te voeren met één enkele Run pipeline opdracht.
Vereisten
Data Prep wordt volledig op org-niveau beheerd en herkent geen individuele workspaces of hun machtigingen.
Dit betekent:
- Data Prep wordt gedeeld door alle geautoriseerde gebruikers in uw org.
- Elke gebruiker met toegang tot Chain Builder heeft ook toegang tot Data Prep.
- Alle gebruikers die ketens kunnen maken of bewerken, zullen de mogelijkheid hebben om pijplijnen in Data Prep te beheren.
- Eén enkele Data Prep pipeline kan in meerdere ketens en workspaces binnen een organisatie worden gebruikt.
Stap 1. De pijplijn aanmaken
Tip: Voordat u de pijplijn aanmaakt, uploadt u vanaf Voorbeeldbestanden, een voorbeeldbestand dat de kolommen en gegevens vertegenwoordigt die het zal transformeren om de kolommen van de pijplijn gemakkelijk te definiëren en een voorbeeld van de toegepaste transformaties mogelijk te maken.
- Klik in Wdata op Chains en Data Prep.
Opmerking: Om toegang te krijgen tot Data Prep vanuit Wdata Chains, moet u eerst een Data Prep connector instellen.
- Vanaf Pipelines , onder Active pipelines, maakt u de pipeline:
- Klik voor de eerste pijplijn op Een pijplijn maken.
- Klik anders op Nieuwe leiding (+) naast de zoekbalk.
- Voer een naam en beschrijving in om de pijplijn te helpen identificeren.
- Klik op maken .
Stap 2. Definieer de kolommen
Om de velden te specificeren waarmee de pijplijn zal interageren, definieert u de kolommen van de gegevens die het transformeert. Wanneer u een kolom definieert, geeft u de naam en het type en formaat van de gegevens op. Voor een kolom met het gegevenstype Getal geeft u bijvoorbeeld de decimale posities op en de tekens die worden gebruikt voor de scheidingstekens tussen decimalen en duizendtallen.
Opmerking: De kolomnamen die voor de pijplijn zijn gedefinieerd, kunnen verschillen van de kolommen in de gegevens die worden getransformeerd.
Om de kolommen van de pijplijn te definiëren, kunt u de kolomdefinitie van een geüpload voorbeeldbestand gebruiken of een afgebakend bestand dat lokaal of op uw netwerk is opgeslagen. U kunt kolommen ook handmatig definiëren.
Om het aanmaken van een pijplijn te vergemakkelijken, raden wij u aan een voorbeeldbestand te gebruiken om de kolommen te definiëren:
Opmerking: Als u een voorbeeldbestand wilt gebruiken, moet u dit eerst uploaden naar Voorbeeldbestanden.
- Klik onder Kolommen definiëren op Kiezen uit lijst.
- Selecteer het voorbeeldbestand met de kolomdefinitie die u wilt gebruiken en klik op OK.
Opmerking: De kolomdefinitie van het voorbeeldbestand vervangt alle kolommen die voor de pijplijn zijn gedefinieerd.
- Bekijk de kolomdefinitie en bewerk de namen van de kolommen indien nodig.
- Klik op Opslaan.
Om de kolommen van de pijplijn te definiëren, kunt u een bestand met dezelfde kolomdefinitie uploaden.
Opmerking: Het bestand moet afgebakend zijn en een kopregel bevatten.
- Klik onder Kolommen definiëren op Maken vanuit bestand.
- Blader naar en selecteer het bestand met de kolomdefinitie die u wilt gebruiken, en klik op OK.
Opmerking: De kolomdefinitie van het bestand vervangt alle kolommen die voor de pijplijn zijn gedefinieerd.
- Bekijk de kolomdefinitie en bewerk indien nodig de namen en gegevenstypen van de kolommen.
Opmerking: Zorg ervoor dat u de kolomdefinitie controleert en bijwerkt. De pijplijn gebruikt kolomnamen uit de kopregel van het bestand en raadt gegevenstypes op basis van de gegevens.
- Klik op Opslaan.
Om handmatig een kolom te definiëren:
- Klik onder Kolommen definiëren op Kolommen toevoegen.
- Selecteer het gegevenstype van de kolom.
- Voer een naam en beschrijving in om de kolom te helpen identificeren.
- Specificeer het formaat van de gegevens van de kolom, gebaseerd op het type:
- Selecteer voor een kolom String een speciale indeling, zoals voor universally unique identifiers (UUID's), binaire strings, e-mailadressen of uniform resource identifier (URI) webadressen.
- Selecteer voor een kolom Integer het scheidingsteken voor duizendtallen.
- Voor een kolom Getal voert u het aantal decimalen in en selecteert u de decimale en duizendtallenscheidingstekens.
- Selecteer voor een Datum, Tijd, of DatumTijd kolom de indeling string-from-time (strftime).
Opmerking: Een Binaire kolom bevat waarden zoals Waar of Onwaar, of 1 of 0.
- Nadat u alle kolommen hebt gedefinieerd, klikt u op Opslaan.
Stap 3. De transformaties instellen
- Om de impact van de transformaties te bekijken, prikt een voorbeeldbestand met de kolommen en gegevens die door de pijplijn moeten worden getransformeerd.
- Klik op Transformatie maken.
- Selecteer de transformatie die u wilt toepassen, en klik op Volgende.
- Stel de transformatie in en klik op Opslaan.
- Om extra transformaties in te stellen, klikt u op Transformatie toevoegen voor of na de bestaande transformatie, op basis van wanneer deze moet plaatsvinden.
Tip: Om nog een instantie van een transformatie toe te voegen die al in de pijplijn zit, klikt u op Kopiëren, en stelt u de nieuwe instantie in zoals nodig.
- Pas de transformaties waar nodig aan:
- Om een transformatie binnen de pijplijn te verplaatsen, klikt u op Ga vooruit of Ga terug.
- Om een transformatie uit de pijplijn te verwijderen, klikt u op Verwijderen.
Opmerking: Als u een transformatie verplaatst of verwijdert, pas dan indien nodig alle transformaties aan die afhankelijk zijn van het resultaat.
Stap 4. De pijplijn publiceren
Wanneer de pijplijn klaar is voor gebruik, klikt u op Publiceren.
Nadat u de pijplijn hebt gepubliceerd, kunt u deze gebruiken met de opdracht Run pipeline of de Data Prep connector om de transformaties toe te passen op tabelgegevens binnen een keten.