Von Data Prep aus können Sie Sequenzen erstellen und ausführen (pipelines), sowie funktionale Transformationen erstellen (mapping groups).
Pipeline ist eine Reihe von technischen Transformationen, die auf tabellarische Ausgaben in Ketten anzuwenden sind. So können Sie zum Beispiel Pipelines mit gemeinsamen Transformationen einrichten, um Daten für Ihre verschiedenen Datensysteme vorzubereiten oder aus diesen zu übernehmen.
Tipp: Wenn Ihre Ketten eine gemeinsame Abfolge von Tabellentransformation und File Utilities Befehlen verwenden, um Daten aus Ihren Aufzeichnungssystemen zu aktualisieren, erstellen Sie Pipelines, um diese Transformationen mit einem einzigen Pipeline ausführen Befehldurchzuführen.
Eine Pipeline kann Transformationen anwenden:
- Ändern des Datenlayouts, z. B. Hinzufügen oder Entfernen von Spalten oder Anpassen ihrer Werte
- Filter anwenden, um Zeilen aus den Daten nach bestimmten Kriterien zu entfernen
- Sortierung der Daten oder Anwendung von Summen auf der Grundlage bestimmter Spalten
- Abbildung von Beziehungen zwischen Datenmodellen auf der Grundlage definierter Regeln
Mapping-Gruppen stellen die Beziehungen zwischen Datenmodellen verschiedener Unternehmenssysteme her, indem sie festlegen, wie die Codes/Werte von einem System in ein anderes umgewandelt werden sollen. Sie werden innerhalb einer Pipeline als Transformationsschritt angewendet.
Mapping-Gruppen unterstützen eine Reihe von Mapping-Techniken, die leistungsstark und dennoch einfach zu verwenden sind und allgemeine oder komplexe Anforderungen erfüllen. Sie sind so konzipiert, dass sie von den Benutzern definiert und aktualisiert werden können, um Daten zu transformieren und zu harmonisieren. Mapping-Gruppen können über mehrere Pipelines hinweg gemeinsam genutzt werden. Die Oberfläche ist sehr Excel-ähnlich und bietet ein vertrautes und freundliches Gefühl.
Anforderungen
Data Prep wird vollständig auf Organisationsebene gesteuert und kennt keine individuellen Arbeitsbereiche oder deren Berechtigungen.
Dies bedeutet:
- Data Prep wird von allen autorisierten Benutzern in Ihrer Organisation gemeinsam genutzt.
- Jeder Benutzer mit Zugriff auf Chain Builder hat auch Zugriff auf Data Prep.
- Alle Benutzer, die Ketten erstellen oder bearbeiten können, haben die Möglichkeit, Pipelines in Data Prep zu verwalten.
- Eine einzige Datenvorbereitungspipeline kann über mehrere Ketten und Arbeitsbereiche innerhalb einer Organisation hinweg verwendet werden.
Schritt 1. Einrichten einer Data Prep-Verbindung
Um die Transformationen einer Pipeline auf Daten in einer Kette anzuwenden, fügen Sie den Befehl Data Prep des Connectors Run pipeline ein. Falls Sie es noch nicht getan haben, richten Sie eine Data Prep Verbindungein. Wenn die Data Prep Verbindung eingerichtet ist, können Sie die Data Prep von Wdata Chains öffnen.
Schritt 2. Hochladen von Beispieldateien
Von Beispieldateien laden Sie Beispieldateien hoch, die die zu transformierenden Tabellendaten darstellen, um die Erstellung der Pipeline zu erleichtern.
in Data Prep,Nach dem Hochladen können Sie eine Beispieldatei verwenden, um:
- Schnelles Definieren der Spalten und Datentypen, mit denen eine Pipeline interagiert
- Vorschau, wie sich eine Pipeline- oder Mapping-Transformation auf die Daten auswirkt
Schritt 3. Gruppen für Mapping-Transformationen erstellen
Um Beziehungen zwischen Datenmodellen innerhalb einer Pipeline abzubilden, können Sie Mapping-Transformationen einfügen. Von Mapping-Gruppen erstellen Sie Mapping-Gruppen um die Beziehungen zwischen Werten zu definieren und wie Werte von einem System in ein anderes innerhalb einer Mapping-Transformation transformiert werden können.
in Data Prep,Tipp: Um Werte für eine Mapping-Transformation festzulegen, wenn die Pipeline läuft, richten Sie Laufzeitvariablen für die Mapping-Gruppe ein.
Wenn Sie eine Zuordnungsgruppe erstellen, können Sie ihre Regeln definieren, um Werte basierend auf einer exakten Übereinstimmung, einem einfachen Muster oder einem regulären Ausdruck umzuwandeln.
Schritt 4. Pipelines einrichten
Eine Pipeline ist die Sammlung von technischen und funktionalen Transformationen, die auf die von Data Prep verarbeiteten Daten angewendet werden.
-
Die in einer Pipeline definierten technischen Transformationen werden zur Änderung des Datenlayouts verwendet. Aktivitäten wie das Hinzufügen oder Entfernen von Spalten, das Umordnen von Spalten oder das Einfügen neuer Spalten sind alles Beispiele für technische Transformationen.
-
Die Funktionstransformation ist der Prozess der Herstellung einer Beziehung zwischen den Datenmodellen der zu integrierenden Systeme. Die funktionale Transformation wird oft als Mapping bezeichnet und wird von Data Prep Mapping Gruppen verwaltet. Mapping-Gruppen werden innerhalb einer Pipeline als Transformationsschritt angewendet.
Um die Reihenfolge der Transformationen zu definieren, die auf tabellarische Daten angewendet werden sollen, erstellt Pipelines aus Pipelines in Data Prep.
Wenn Sie eine Pipeline erstellen, können Sie:
- Definieren Sie die Spalten und Datentypen, mit denen es interagiert, entweder manuell oder auf der Grundlage einer Beispieldatei oder einer hochgeladenen Datei mit Trennzeichen
- Einrichten der Transformationen, die bei der Ausführung der Pipeline in der richtigen Reihenfolge angewendet werden sollen
Tipp: Um Werte für eine Transformation festzulegen, wenn die Pipeline ausgeführt wird, richten Sie Laufzeitvariablen für die Pipeline ein.
Schritt 5. Pipelines in Ketten ausführen
Um die Transformationen auf tabellarische Daten aus einer früheren Ausgabe in einer Kette anzuwenden, verwenden Sie den Data Prep Connector's Run pipeline Befehl. Wenn Sie den Befehl einrichten, müssen Sie:
- Wählen Sie die auszuführende Pipeline und die zu transformierende tabellarische Ausgabe
- Zuordnung der Spalten der Tabellendatei zur Spaltendefinition der Pipeline
- Legen Sie alle Laufzeitvariablenwerte für die Pipeline fest