Para facilitar a criação de pipelines ou grupos de mapeamento, você pode usar arquivos de amostra para indicar alguns ou todos os dados a serem transformados.
Observação: O arquivo de amostra é e não transformado pelo pipeline; ele apenas ajuda a simplificar a criação do pipeline e permite uma visualização do impacto das transformações.
Requisitos
O Data Prep é controlado inteiramente em nível de organização e não reconhece espaços de trabalho individuais ou suas permissões.
Isso significa que você pode usar o Data Prep:
- O Data Prep é compartilhado entre todos os usuários autorizados em sua organização.
- Qualquer usuário com acesso ao Chain Builder também tem acesso ao Data Prep.
- Todos os usuários que podem criar ou editar cadeias terão a capacidade de gerenciar pipelines no Data Prep.
- Um único pipeline do Data Prep pode ser usado em várias cadeias e espaços de trabalho em uma organização.
Especificações do arquivo de amostra
Para ser usado por um pipeline, o arquivo de amostra deve:
- Ter até 1 MB
- Incluir uma linha de cabeçalho
- Incluir um delimitador - uma vírgula (,), tabulação, pipe (|) ou ponto e vírgula (;)
- Ser visualizável em um editor de texto, como o Notepad++, Wordpad ou Textpad
- Tenha um layout de dados consistente para todas as linhas
Dica: Embora os nomes de cabeçalho e a ordem das colunas no arquivo de amostra não precisem corresponder aos dados reais transformados pelo pipeline, alinhe o arquivo de amostra e os dados reais sempre que possível para evitar confusão e facilitar ainda mais a criação do pipeline.
Por exemplo:
PERIOD,YEAR,ENTITY,ACCOUNT,PRODUCT,AMOUNT JAN,2O21,US,SALES,REGULAR-COLA,12500 JAN,2021,US,SALES,DIET-COLA,10000 JAN,2021,US,SALARIES,,3000
Observação: As colunas definidas pelo arquivo de amostra podem conter valores nulos ou em branco, como o campo em branco PRODUCT na quarta linha do exemplo.
Fazer upload de arquivos de amostra
Para fazer upload de um arquivo de amostra:
- Em Wdata Chains, clique em Data Prep.
Observação: Para acessar o Data Prep do Wdata Cadeias, primeiro configure um conector Data Prep.
- Em Sample files , clique em Add files (+) ao lado da barra de pesquisa.
- Em File upload, arraste ou navegue até o arquivo a ser carregado.
- Em Columns, revise e ajuste a definição de coluna do arquivo conforme necessário.
- Clique em Salvar.
Editar a definição de coluna de um arquivo de amostra
Quando você definir uma coluna de arquivos de amostra, selecione o tipo de dados que ela contém:
| Tipo de dados | Descrição | Exemplo de valores |
|---|---|---|
| String | Uma sequência de caracteres alfanuméricos | Califórnia, 400010 |
| Inteiro | Um número inteiro, com ou sem um separador de milhares | 25, 37450 |
| Número | Um número que inclui um decimal, com ou sem um separador de milhares | 15,75, 37865,95, 25.789,62 |
| Booliano | Um valor verdadeiro ou falso | True ou 1, False ou 0 |
| Data | Uma data com dia, mês e ano | 1/1/2021, 2021-01-01 |
| Tempo | Uma hora do dia | 14:37, 09:52:10 |
| DateTime | Uma data e um registro de data e hora | 2021-01-01T18:26:33 |
Para editar a definição de coluna de um arquivo de amostra, clique na linha do arquivo:
- Em Sample files , clique na linha do arquivo.
- Clique em Columns e, em seguida, ajuste o tipo de dados e os detalhes conforme necessário.
- Clique em Salvar.
Observação: Para editar ou excluir uma coluna do arquivo de amostra, use a guia Pipelines .
Saiba mais sobre o gerenciamento de pipelines.
Fixar um arquivo de amostra em um pipeline
Para permitir uma visualização das transformações que um pipeline aplica aos dados, fixe um arquivo de amostra com a mesma definição de coluna:
- Em Pipelines , abra o pipeline.
- Na guia Files , clique em Pin file para o arquivo de amostra.
Observação: Se necessário, clique em Fazer upload de arquivos de amostra para fazer upload do arquivo de amostra para Arquivos de amostra.
- Mapeie as colunas do arquivo de amostra para a definição de coluna do pipeline.
Observação: O pipeline mapeia automaticamente as colunas com o mesmo nome exato e o mesmo tipo de dados. Você só pode mapear colunas com o mesmo tipo de dados.
- Clique em “Enviar”
Fixar um arquivo de amostra em um grupo de mapeamento
Para permitir uma visualização das regras que um grupo de mapeamento aplica à sua coluna primária, fixe um arquivo de amostra indicativo dos dados que ele mapeará:
- Em Mapping groups , abra o grupo de mapeamento.
- Na guia Files , clique em Pin file para o arquivo de amostra.
- Em Match columns, selecione quais colunas do arquivo mapeiam para as colunas do grupo de mapeamento.
Observação: Você só pode mapear colunas com o mesmo tipo de dados.
- Clique em “Enviar”
Excluir um arquivo de amostra
Para remover um arquivo de amostra que você não precisa mais de Arquivos de amostra , clique em Delete.