Depois de criar um pipeline , você pode gerenciar seus detalhes, a definição de colunas e as transformações, conforme necessário.
Requisitos
O Data Prep é controlado inteiramente em nível de organização e não reconhece espaços de trabalho individuais ou suas permissões.
Isso significa que você pode usar o Data Prep:
- O Data Prep é compartilhado entre todos os usuários autorizados em sua organização.
- Qualquer usuário com acesso ao Chain Builder também tem acesso ao Data Prep.
- Todos os usuários que podem criar ou editar cadeias terão a capacidade de gerenciar pipelines no Data Prep.
- Um único pipeline do Data Prep pode ser usado em várias cadeias e espaços de trabalho em uma organização.
Editar a definição da coluna de um pipeline
Você pode atualizar o nome, o tipo de dados ou o formato da coluna de um pipeline a qualquer momento. Quando você definir a coluna de um pipeline, selecione o tipo de dados que ela contém:
| Tipo de dados | Descrição | Exemplo de valores |
|---|---|---|
| String | Uma sequência de caracteres alfanuméricos | Califórnia, 400010 |
| Inteiro | Um número inteiro, com ou sem um separador de milhares | 25, 37450 |
| Número | Um número que inclui um decimal, com ou sem um separador de milhares | 15.75, 37865.95, 25,789.62 |
| Booliano | Um valor verdadeiro ou falso | True ou 1, False ou 0 |
| Data | Uma data com dia, mês e ano | 1/1/2021, 2021-01-01 |
| Tempo | Uma hora do dia | 14:37, 09:52:10 |
| DateTime | Uma data e um registro de data e hora | 2021-01-01T18:26:33 |
Você pode definir as colunas de um pipeline manualmente ou usar a definição de coluna de um arquivo de amostra ou de upload de arquivo.
Para facilitar a criação do pipeline, recomendamos que você use um arquivo de amostra para definir suas colunas:
Observação: Para usar um arquivo de amostra, primeiro carregue-o em Arquivos de amostra.
- Em Wdata Chains, clique em Data Prep.
- Em Pipelines , abra o pipeline.
- Na guia Colunas , clique em Editar colunas.
- Em Definir colunas, clique em Escolher da lista.
- Selecione o arquivo de amostra com a definição de coluna a ser usada e clique em OK.
Observação: A definição de coluna do arquivo de amostra substituirá todas as colunas definidas para o pipeline.
- Revise a definição da coluna e edite os nomes das colunas conforme necessário.
- Clique em Salvar.
Para definir as colunas do pipeline, você pode carregar um arquivo com a mesma definição de coluna.
Observação: O arquivo deve ser delimitado e conter uma linha de cabeçalho.
- Em Wdata Chains, clique em Data Prep.
- Em Pipelines , abra o pipeline.
- Na guia Colunas , clique em Editar colunas.
- Em Definir colunas, clique em Criar a partir do arquivo.
- Navegue até o arquivo com a definição de coluna a ser usada, selecione-o e clique em OK.
Observação: A definição de coluna do arquivo substituirá todas as colunas definidas para o pipeline.
- Revise a definição da coluna e edite os nomes das colunas e os tipos de dados, conforme necessário.
Observação: Não deixe de revisar e atualizar a definição da coluna. O pipeline usa nomes de colunas da linha de cabeçalho do arquivo e adivinha os tipos de dados com base nos dados.
- Clique em Salvar.
Para definir manualmente uma coluna:
- Em Wdata Chains, clique em Data Prep.
- Em Pipelines , abra o pipeline.
- Na guia Colunas , clique em Editar colunas.
- Em Definir colunas, clique em Adicionar colunas.
- Selecione o tipo de dados da coluna.
- Digite um nome e uma descrição para ajudar a identificar a coluna.
- Especifique o formato dos dados da coluna, com base em seu tipo:
- Para uma coluna String, selecione qualquer formato especial, como para identificadores universalmente exclusivos (UUIDs), cadeias binárias, endereços de e-mail ou endereços da Web com identificador uniforme de recursos (URI).
- Para uma coluna Integer, selecione o separador de milhares.
- Para uma coluna Number, insira o número de casas decimais e selecione os separadores de decimais e milhares.
- Para uma coluna Date, Time, ou DateTime, selecione o formato string-from-time (strftime).
Observação: A Binary coluna contém valores como True ou False, ou 1 ou 0.
- Depois de definir todas as colunas, clique em Salvar.
Copiar um pipeline
Para criar rapidamente um novo pipeline com colunas ou transformações semelhantes às de outro pipeline, comece com uma cópia do pipeline existente:
- Em Pipelines , clique em Copy para o pipeline existente.
- Para renomear o novo pipeline, edite seu nome e clique em OK.
- Edite a definição da coluna ou as transformações, conforme necessário.
- Clique em Publicar.
Arquivar um pipeline
Se você não usar mais um pipeline, poderá arquivá-lo para que ele não fique mais ativo:
- Em Pipelines , na guia Active, clique em Archive para o pipeline.
- No pipeline, selecione Archive em seu menu.
Observação: Para retornar um pipeline arquivado ao status Active, em Pipelines, selecione a guia Archived e clique em Unarchive para o pipeline.
Excluir um pipeline
Para remover completamente um pipeline, você pode excluí-lo.
Observação: Ao contrário de um pipeline arquivado, você não pode restaurar um pipeline excluído. Exclua um pipeline somente se você não precisar mais dele novamente.
- Em Pipelines , arquive o pipeline, se estiver ativo.
- Na guia Archived, clique em Delete para o pipeline.
- Em Confirmar, digite
delete. - Clique em Excluir.