Aby przekształcić dane tabelaryczne za pomocą konektora Data Prep , należy najpierw skonfigurować sekwencję - lub potok - przekształceń do zastosowania. Potok zapewnia graficzną reprezentację zdefiniowanych transformacji i umożliwia podgląd wpływu każdej transformacji.
Wskazówka: Jeśli twoje łańcuchy używają wspólnej sekwencji poleceń Tabular Transformation i File Utilities do aktualizacji danych z systemów rekordów, utwórz potoki, aby wykonać te transformacje za pomocą jednego polecenia Run pipeline .
Wymagania
Data Prep jest kontrolowany całkowicie na poziomie organizacji i nie rozpoznaje poszczególnych obszarów roboczych ani ich uprawnień.
Oznacza to:
- Data Prep jest udostępniane wszystkim autoryzowanym użytkownikom w Twojej organizacji.
- Każdy użytkownik z dostępem do Chain Builder ma również dostęp do Data Prep.
- Wszyscy użytkownicy, którzy mogą tworzyć lub edytować łańcuchy, będą mogli zarządzać potokami w Data Prep.
- Pojedynczy potok Data Prep może być używany w wielu łańcuchach i obszarach roboczych w organizacji.
Krok 1. Utwórz rurociąg
Wskazówka: Przed utworzeniem potoku, na stronie Sample files, prześlij przykładowy plik reprezentujący kolumny i dane, które będą przekształcane, aby łatwo zdefiniować kolumny potoku i umożliwić podgląd zastosowanych przekształceń.
- Na stronie Wdata kliknij Chains i Data Prep.
Uwaga: Aby uzyskać dostęp do Data Prep z Wdata Chains, najpierw skonfiguruj Data Prep connector.
- Na stronie Pipelines , w sekcji Active pipelines, utwórz potok:
- W przypadku pierwszego rurociągu kliknij Create a pipeline.
- W przeciwnym razie kliknij New pipeline (+) obok paska wyszukiwania.
- Wprowadź nazwę i opis, aby ułatwić identyfikację rurociągu.
- Kliknij Utwórz.
Krok 2. Zdefiniuj kolumny
Aby określić pola, z którymi potok będzie wchodził w interakcje, zdefiniuj kolumny danych, które przekształca. Definiując kolumnę, określasz jej nazwę oraz typ i format danych. Na przykład, dla kolumny z typem danych Number, określ jej miejsca dziesiętne i znaki używane dla separatorów dziesiętnych i tysięcy.
Uwaga: Nazwy kolumn zdefiniowane dla potoku mogą różnić się od kolumn w danych, które przekształca.
Aby zdefiniować kolumny potoku, możesz użyć definicji kolumny z przesłanego przykładowego pliku lub rozdzielonego pliku zapisanego lokalnie lub w sieci. Możesz także ręcznie zdefiniować kolumny.
Aby ułatwić tworzenie potoku, zalecamy użycie przykładowego pliku do zdefiniowania jego kolumn:
Uwaga: Aby użyć przykładowego pliku, najpierw prześlij go na stronę Przykładowe pliki.
- Pod Zdefiniuj kolumny, kliknij Wybierz z listy.
- Wybierz przykładowy plik z definicją kolumny do użycia i kliknij OK.
Uwaga: Definicja kolumny przykładowego pliku zastąpi wszystkie kolumny zdefiniowane dla potoku.
- Przejrzyj definicję kolumn i w razie potrzeby edytuj ich nazwy.
- Kliknij Zapisz.
Aby zdefiniować kolumny potoku, możesz przesłać plik z tą samą definicją kolumny.
Uwaga: Plik musi być rozdzielony i zawierać wiersz nagłówka.
- W sekcji Zdefiniuj kolumny kliknij Utwórz z pliku.
- Przejdź do pliku z definicją kolumny i wybierz go, a następnie kliknij przycisk OK.
Uwaga: Definicja kolumny pliku zastąpi wszystkie kolumny zdefiniowane dla potoku.
- Przejrzyj definicję kolumn i w razie potrzeby edytuj ich nazwy i typy danych.
Uwaga: Pamiętaj, aby przejrzeć i zaktualizować definicję kolumny. Potok używa nazw kolumn z wiersza nagłówka pliku i zgaduje typy danych na podstawie danych.
- Kliknij Zapisz.
Aby ręcznie zdefiniować kolumnę:
- Pod Zdefiniuj kolumny, kliknij Dodaj kolumny.
- Wybierz typ danych kolumny.
- Wprowadź nazwę i opis, aby ułatwić identyfikację kolumny.
- Określ format danych kolumny na podstawie jej typu:
- W przypadku kolumny String wybierz dowolny specjalny format, taki jak uniwersalne unikatowe identyfikatory (UUID), ciągi binarne, adresy e-mail lub adresy internetowe z jednolitym identyfikatorem zasobów (URI).
- W przypadku kolumny Integer wybierz separator tysięcy.
- W przypadku kolumny Number wprowadź liczbę miejsc po przecinku i wybierz separator dziesiętny i separator tysięcy.
- Dla kolumny Date, Time lub DateTime wybierz jej format string-from-time (strftime).
Uwaga: A Binary kolumna zawiera wartości takie jak True lub False, lub 1 lub 0.
- Po zdefiniowaniu wszystkich kolumn kliknij Zapisz.
Krok 3. Skonfiguruj transformacje
- Aby wyświetlić podgląd wpływu transformacji, przypina przykładowy plik wskazujący kolumny i dane, które mają zostać przekształcone przez potok.
- Kliknij Utwórz transformację.
- Wybierz transformację do zastosowania, a następnie kliknij Next.
- Skonfiguruj transformację i kliknij Zapisz.
- Aby skonfigurować dodatkowe przekształcenia, kliknij Dodaj przekształcenie przed lub po istniejącym przekształceniu, w zależności od tego, kiedy ma ono nastąpić.
Wskazówka: Aby dodać kolejne wystąpienie transformacji znajdującej się już w potoku, kliknij jego Kopiuj i skonfiguruj nowe wystąpienie zgodnie z potrzebami.
- W razie potrzeby dostosuj przekształcenia:
- Aby zmienić położenie przekształcenia w potoku, kliknij jego Przesuń do przodu lub Przesuń do tyłu.
- Aby usunąć przekształcenie z potoku, kliknij jego Usuń.
Uwaga: Jeśli przeniesiesz lub usuniesz przekształcenie, dostosuj w razie potrzeby wszystkie przekształcenia zależne od jego wyniku.
Krok 4. Opublikuj potok
Gdy rurociąg będzie gotowy do użycia, kliknij Publish.
Po opublikowaniu potoku możesz użyć go z poleceniem Run pipeline Data Prep , aby zastosować jego transformacje do danych tabelarycznych w łańcuchu.