Après avoir créé un pipeline, vous pouvez en gérer les détails, la définition des colonnes et les transformations si nécessaire.
Exigences
Data Prep est entièrement contrôlé au niveau de l'organisation et ne reconnaît pas les espaces de travail individuels ni leurs autorisations.
Cela signifie que :
- Les données Prep sont partagées entre tous les utilisateurs autorisés de votre organisation.
- Tout utilisateur ayant accès à Chain Builder a également accès à Data Prep.
- Tous les utilisateurs qui peuvent créer ou modifier des chaînes auront la possibilité de gérer des pipelines dans Data Prep.
- Un seul pipeline de Data Prep peut être utilisé sur plusieurs chaînes et espaces de travail au sein d'une organisation.
Modifier la définition des colonnes d'un pipeline
Vous pouvez à tout moment modifier le nom, le type de données ou le format de la colonne d'un pipeline. Lorsque vous définissez la colonne d'un pipeline, sélectionnez le type de données qu'elle contient :
| Type de données | Description | Exemples de valeurs |
|---|---|---|
| Chaîne | Une séquence de caractères alphanumériques | Californie, 400010 |
| Entier | Un nombre entier, avec ou sans séparateur de milliers | 25, 37450 |
| Nombre | Un nombre comprenant une décimale, avec ou sans séparateur de milliers. | 15.75, 37865.95, 25,789.62 |
| Valeur booléenne | Une valeur vraie ou fausse | Vrai ou 1, Faux ou 0 |
| Date | Une date avec un jour, un mois et une année | 1/1/2021, 2021-01-01 |
| Heure | Un moment de la journée | 14:37, 09:52:10 |
| DateTime | Une date et un horodatage | 2021-01-01T18:26:33 |
Vous pouvez définir les colonnes d'un pipeline manuellement ou utiliser la définition des colonnes d'un fichier d'exemple ou d'un fichier téléchargé.
Pour faciliter la création d'un pipeline, nous vous recommandons d'utiliser un fichier d'exemple pour définir ses colonnes :
Remarque : Pour utiliser un fichier d'exemple, il faut d'abord le télécharger sur Fichiers d'exemple.
- À partir de Wdata Chains, cliquez sur Data Prep.
- À partir de Pipelines , ouvrez le pipeline.
- Dans l'onglet Colonnes , cliquez sur Modifier les colonnes.
- Sous Define columns, cliquez sur Pick from list.
- Sélectionnez le fichier d'exemple contenant la définition de colonne à utiliser et cliquez sur OK.
Remarque : La définition des colonnes du fichier d'exemple remplacera toutes les colonnes définies pour le pipeline.
- Examinez la définition des colonnes et modifiez leur nom si nécessaire.
- Cliquez sur Enregistrer.
Pour définir les colonnes du pipeline, vous pouvez télécharger un fichier contenant la même définition de colonne.
Note : Le fichier doit être délimité et contenir une ligne d'en-tête.
- À partir de Wdata Chains, cliquez sur Data Prep.
- À partir de Pipelines , ouvrez le pipeline.
- Dans l'onglet Colonnes , cliquez sur Modifier les colonnes.
- Sous Définir les colonnes, cliquez sur Créer à partir du fichier.
- Recherchez et sélectionnez le fichier contenant la définition de colonne à utiliser, puis cliquez sur OK.
Note : La définition des colonnes du fichier remplacera toutes les colonnes définies pour le pipeline.
- Examinez la définition des colonnes et modifiez les noms et les types de données des colonnes si nécessaire.
Note : Veillez à revoir et à mettre à jour la définition de la colonne. Le pipeline utilise les noms de colonnes de la ligne d'en-tête du fichier et devine les types de données sur la base des données.
- Cliquez sur Enregistrer.
Pour définir manuellement une colonne :
- À partir de Wdata Chains, cliquez sur Data Prep.
- À partir de Pipelines , ouvrez le pipeline.
- Dans l'onglet Colonnes , cliquez sur Modifier les colonnes.
- Sous Définir les colonnes, cliquez sur Ajouter des colonnes.
- Sélectionnez le type de données de la colonne.
- Entrez un nom et une description pour aider à identifier la colonne.
- Spécifier le format des données de la colonne, en fonction de son type :
- Pour une colonne String, sélectionnez un format spécial, par exemple pour les identificateurs universels uniques (UUID), les chaînes binaires, les adresses électroniques ou les identificateurs de ressources uniformes (URI) des adresses web.
- Pour une colonne Integer, sélectionnez le séparateur de milliers.
- Pour une colonne Number, entrez le nombre de décimales et sélectionnez les séparateurs de décimales et de milliers.
- Pour une colonne Date, Time, ou DateTime, sélectionnez son format string-from-time (strftime).
Note : Une colonne binaire contient des valeurs telles que Vrai ou Faux, ou 1 ou 0.
- Après avoir défini toutes les colonnes, cliquez sur enregistrer.
Copier un pipeline
Pour créer rapidement un nouveau pipeline avec des colonnes ou des transformations similaires à celles d'un autre pipeline, commencez par une copie du pipeline existant :
- À partir de Pipelines , cliquez sur Copy pour le pipeline existant.
- Pour renommer le nouveau pipeline, modifiez son nom et cliquez sur OK.
- Modifiez la définition de la colonne ou les transformations si nécessaire.
- Cliquez sur Publier.
Archiver un pipeline
Si vous n'utilisez plus un pipeline, vous pouvez l'archiver pour qu'il ne soit plus actif :
- À partir de Pipelines , dans l'onglet Active, cliquez sur Archive pour le pipeline.
- Dans le pipeline, sélectionnez Archive dans son menu.
Remarque : Pour rétablir le statut actif d'un pipeline archivé, à partir de Pipelines, sélectionnez l'onglet Archivé et cliquez sur Unarchive pour le pipeline.
Supprimer une canalisation
Pour supprimer complètement une canalisation, vous pouvez la supprimer.
Note : Contrairement à un pipeline archivé, vous ne pouvez pas restaurer un pipeline supprimé. Ne supprimez un pipeline que si vous n'en avez plus besoin.
- À partir de Pipelines , archivez le pipeline s'il est actif.
- Dans l'onglet Archivé, cliquez sur Supprimer pour le pipeline.
- Dans Confirmer, entrer
supprimer. - Cliquez sur Supprimer.