Nachdem Sie eine Pipeline erstellt haben, können Sie deren Details, Spaltendefinition und Transformationen nach Bedarf verwalten.
Anforderungen
Data Prep wird vollständig auf Organisationsebene gesteuert und kennt keine individuellen Arbeitsbereiche oder deren Berechtigungen.
Dies bedeutet:
- Data Prep wird von allen autorisierten Benutzern in Ihrer Organisation gemeinsam genutzt.
- Jeder Benutzer mit Zugriff auf Chain Builder hat auch Zugriff auf Data Prep.
- Alle Benutzer, die Ketten erstellen oder bearbeiten können, haben die Möglichkeit, Pipelines in Data Prep zu verwalten.
- Eine einzige Datenvorbereitungspipeline kann über mehrere Ketten und Arbeitsbereiche innerhalb einer Organisation hinweg verwendet werden.
Bearbeiten der Spaltendefinition einer Pipeline
Sie können den Namen, den Datentyp oder das Format der Spalte einer Pipeline jederzeit aktualisieren. Wenn Sie die Spalte einer Pipeline definieren, wählen Sie den Typ der darin enthaltenen Daten aus:
| Datentyp | Beschreibung | Beispielwerte |
|---|---|---|
| Zeichenfolge | Eine Folge von alphanumerischen Zeichen | Kalifornien, 400010 |
| Ganzzahl | Eine ganze Zahl, mit oder ohne Tausendertrennzeichen | 25, 37450 |
| Nummer | Eine Zahl, die eine Dezimalzahl enthält, mit oder ohne Tausendertrennzeichen | 15.75, 37865.95, 25,789.62 |
| Boolesch | Ein wahrer oder falscher Wert | Wahr oder 1, Falsch oder 0 |
| Datum | Ein Datum mit Tag, Monat und Jahr | 1/1/2021, 2021-01-01 |
| Zeit | Eine Tageszeit | 14:37, 09:52:10 |
| DateTime | Ein Datum und ein Zeitstempel | 2021-01-01T18:26:33 |
Sie können die Spalten einer Pipeline manuell definieren oder die Spaltendefinition aus einer Beispieldatei oder einem Datei-Upload verwenden.
Um die Erstellung der Pipeline zu erleichtern, empfehlen wir Ihnen, eine Beispieldatei zu verwenden, um die Spalten zu definieren:
Hinweis: Um eine Beispieldatei zu verwenden, laden Sie sie zunächst auf hoch Beispieldateien.
- Von Wdata Chains, klicken Sie auf Data Prep.
- Öffnen Sie unter Pipelines die Pipeline.
- Klicken Sie auf der Registerkarte Spalten auf Spalten bearbeiten.
- Unter Spalten definieren, klicken Sie auf Aus Liste auswählen.
- Wählen Sie die Beispieldatei mit der zu verwendenden Spaltendefinition aus, und klicken Sie auf OK.
Hinweis: Die Spaltendefinition der Beispieldatei ersetzt alle für die Pipeline definierten Spalten.
- Überprüfen Sie die Spaltendefinition und bearbeiten Sie die Namen der Spalten, falls erforderlich.
- Klicken Sie auf Speichern.
Um die Spalten der Pipeline zu definieren, können Sie eine Datei mit der gleichen Spaltendefinition hochladen.
Hinweis: Die Datei muss mit Trennzeichen versehen sein und eine Kopfzeile enthalten.
- Von Wdata Chains, klicken Sie auf Data Prep.
- Öffnen Sie unter Pipelines die Pipeline.
- Klicken Sie auf der Registerkarte Spalten auf Spalten bearbeiten.
- Unter Spalten definieren, klicken Sie auf Aus Datei erstellen.
- Wählen Sie die Datei mit der zu verwendenden Spaltendefinition aus, und klicken Sie auf OK.
Hinweis: Die Spaltendefinition der Datei ersetzt alle für die Pipeline definierten Spalten.
- Überprüfen Sie die Spaltendefinition und bearbeiten Sie die Namen und Datentypen der Spalten, falls erforderlich.
Hinweis: Überprüfen und aktualisieren Sie unbedingt die Spaltendefinition. Die Pipeline verwendet die Spaltennamen aus der Kopfzeile der Datei und errät die Datentypen anhand der Daten.
- Klicken Sie auf Speichern.
So definieren Sie eine Spalte manuell:
- Von Wdata Chains, klicken Sie auf Data Prep.
- Öffnen Sie unter Pipelines die Pipeline.
- Klicken Sie auf der Registerkarte Spalten auf Spalten bearbeiten.
- Unter Spalten definieren, klicken Sie auf Spalten hinzufügen.
- Wählen Sie den Datentyp der Spalte aus.
- Geben Sie einen Namen und eine Beschreibung ein, um die Spalte zu identifizieren.
- Geben Sie das Format der Spaltendaten auf der Grundlage ihres Typs an:
- Wählen Sie für die Spalte String ein spezielles Format aus, z. B. für universell eindeutige Bezeichner (UUIDs), binäre Strings, E-Mail-Adressen oder URI-Webadressen (Uniform Resource Identifier).
- Wählen Sie für die Spalte Ganzzahl das Tausendertrennzeichen.
- Für eine Spalte Zahl geben Sie die Anzahl der Dezimalstellen ein und wählen die Dezimal- und Tausendertrennzeichen aus.
- Für eine Spalte Datum, Zeit oder DateTime wählen Sie das Format string-from-time (strftime).
Hinweis: Eine Binärspalte enthält Werte wie Wahr oder Falsch, oder 1 oder 0.
- Nachdem Sie alle Spalten definiert haben, klicken Sie auf Speichern.
Kopieren einer Pipeline
Um schnell eine neue Pipeline mit ähnlichen Spalten oder Transformationen wie eine andere Pipeline zu erstellen, beginnen Sie mit einer Kopie der vorhandenen Pipeline:
- Klicken Sie unter Pipelines auf Copy für die vorhandene Pipeline.
- Um die neue Pipeline umzubenennen, bearbeiten Sie ihren Namen, und klicken Sie auf OK.
- Bearbeiten Sie die Spaltendefinition oder die Transformationen nach Bedarf.
- Klicken Sie auf Veröffentlichen.
Archivieren einer Pipeline
Wenn Sie eine Pipeline nicht mehr verwenden, können Sie sie archivieren, damit sie nicht mehr aktiv ist:
- Klicken Sie unter Pipelines auf der Registerkarte Aktiv auf Archiv für die Pipeline.
- Wählen Sie in der Pipeline aus dem Menü Archiv.
Hinweis: Um eine archivierte Pipeline wieder in den Status Aktiv zu versetzen, wählen Sie unter Pipelines die Registerkarte Archiviert und klicken Sie auf Archivierung aufheben für die Pipeline.
Löschen einer Pipeline
Um eine Pipeline vollständig zu entfernen, können Sie sie löschen.
Hinweis: Im Gegensatz zu einer archivierten Pipeline können Sie eine gelöschte Pipeline nicht wiederherstellen. Löschen Sie eine Pipeline nur, wenn Sie sie nicht mehr benötigen.
- Aus Pipelines , archivieren Sie die Pipeline, wenn sie aktiv ist.
- Klicken Sie auf der Registerkarte Archiviert auf Löschen für die Pipeline.
- Geben Sie in Bestätigen
Löschenein. - Klicken Sie auf Löschen.