Una canalización puede aplicar distintos tipos de transformaciones, en función de cómo se desee afectar a los datos tabulares. Cada Pipeline requiere al menos una (1) transformación y se le puede asignar un número prácticamente ilimitado de transformaciones.
Nota: Cuando configure una transformación que utilice un operador de comparación, como contiene
, mayor que
, igual (=
), o no igual (!=
), pulse ENTER después de su valor.
Estas transformaciones se agrupan en cuatro (4) categorías:
- Transformar (transformaciones técnicas): modificar la disposición de los datos de la carga útil.
- Filtro - Elimina filas de la carga útil de datos basándose en un criterio/criterio.
- Datos - Ordene los datos por campos específicos y aplique la suma para obtener puntos de datos.
- Mapeo (Transformaciones Funcionales) - construir relaciones entre campos de datos.
Añadir transformaciones a un Pipeline es un proceso muy guiado, pero no prescriptivo. Esto garantiza la máxima flexibilidad para responder a sus necesidades de transformación
Nota: Antes de añadir transformaciones a su Pipeline, asegúrese de fijar un archivo de ejemplo.
Requisitos
Data Prep se controla totalmente a nivel orgánico y no reconoce los espacios de trabajo individuales ni sus permisos.
Es decir:
- Data Prep se comparte entre todos los usuarios autorizados de su org.
- Cualquier usuario con acceso a Chain Builder también tiene acceso a Data Prep.
- Todos los usuarios que puedan crear o editar cadenas tendrán la capacidad de gestionar canalizaciones en Data Prep.
- Una única canalización de preparación de datos puede utilizarse en varias cadenas y espacios de trabajo de una organización.
Transformar
Para modificar el diseño de los datos tabulares, como añadir o eliminar columnas o ajustar sus valores, añada una transformación Transform .
Nota: Al añadir una columna, se especifica su nombre, el tipo y formato de sus valores y dónde debe aparecer en los datos tabulares.
Transformación | Descripción |
---|---|
Insertar columna | Añade un campo al conjunto de datos con un valor en cada fila. Cuando configure esta transformación, especifique el valor estático o variable de las columnas. |
Insertar números de fila | Añade una columna con numeración de filas al conjunto de datos. Cuando configure esta transformación, especifique el número inicial de las filas. |
Fórmula Excel | Añade una columna con el resultado de una operación realizada en las columnas especificadas, basada en una fórmula de Microsoft Excel®. Cuando configure esta transformación, especifique la fórmula a realizar. Cuando escriba la fórmula, refiérase a las columnas por sus encabezados, como SUM(importe1, importe 2) . Nota: Al contrario que en Excel, no comienza con un operador |
Eliminar columnas | Elimina las columnas especificadas del conjunto de datos |
Fusionar columnas | Añade una columna con los valores combinados de las columnas especificadas, separadas por un delimitador especificado |
Cambiar nombre | Cambia el nombre de las columnas especificadas en el conjunto de datos |
Columna de turnos | Reposiciona una columna especificada dentro del conjunto de datos |
Dividir valor de campo | Divide los valores de una columna en varias columnas, basándose en un delimitador especificado |
Mantener columnas | Elimina todas las columnas del conjunto de datos excepto las especificadas |
Cartel | Invierte el signo de los valores de una columna especificada, por ejemplo, de positivo a negativo, o viceversa |
Mayúsculas | Convierte los valores de una columna especificada a todas MAYÚSCULAS |
Minúsculas | Convierte los valores de una columna especificada a minúsculas |
Buscar y reemplazar texto | Sustituye todas las instancias de un valor de texto especificado en el conjunto de datos por un nuevo valor especificado |
Grupo por | Agrega el conjunto de datos en registros únicos basados en columnas especificadas, de forma similar a una sentencia SQL GROUP BY |
Copiar columna | Añade un duplicado de una columna especificada |
Cadena de distancia | Calcula el número de ediciones (es decir, la "distancia") necesarias para convertir una cadena de texto en la otra. También conocida como transformación de distancia Levenshtein. Cada cadena está limitada a un máximo de 1024 caracteres; se calcula una distancia máxima de 100. |
Sugerencia: Para eliminar filas de un conjunto de datos, utilice una palabra clave -como Ignorar
- para indicar las filas que desea eliminar. A continuación, utilice la palabra clave como valor de a en una transformación de asignación y configure una transformación de filtro inteligente con una condición O para eliminar cualquier campo asignado con esa palabra clave.
Filtrar
Para eliminar filas de los datos basándose en criterios específicos, añada una transformación Filter .
Transformación | Descripción |
---|---|
Coincidencia exacta | Elimina todas las filas que no coinciden exactamente con el texto especificado |
Coincidencia RegExp | Elimina todas las filas que no coinciden con la expresión regular especificada (RegExp) |
Toma filas | Elimina todas las filas a partir del número especificado. Por ejemplo, 10: elimina la décima fila y todas las filas siguientes. |
Filtro inteligente | Elimina o conserva los registros de una columna en función de las condiciones especificadas |
Datos
Para ordenar datos tabulares o aplicar sumas basadas en columnas específicas, añada una transformación Data .
Transformación | Descripción |
---|---|
Ordenar | Ordena el conjunto de datos en función de las columnas especificadas |
Suma si | Crea una salida de canalización adicional con la suma de todos los valores de una columna especificada |
Cartografía
Para transformar los valores de una columna basándose en reglas definidas por un grupo de mapeo, añada una transformación Mapeo :
- Seleccione Mapeo, y haga clic en Siguiente.
- Seleccione el grupo de asignación con las reglas a aplicar.
- En Columnas coincidentes, seleccione qué columnas de la canalización coinciden con las del grupo de asignación.
- Haz clic en Guardar.
Si aplica varias transformaciones de Mapping a una columna, asegúrese de que están en el orden correcto dentro de la canalización.
Sugerencia: Cuando una canalización aplica una transformación Mapping , transforma los valores de la columna en línea. Para ver los valores de una columna antes y después de la transformación al mismo tiempo, aplique una transformación Copiar columna para añadir un duplicado de la columna antes de la transformación Mapeo . Para indicar el estado "antes" de los valores de la copia, añada un prefijo a su nombre, como Src_
o UM_
, para Fuente o Sin mapear, respectivamente. Para eliminar posteriormente esta columna del conjunto de datos, aplique una transformación Agrupar por o Eliminar columnas .
Funciones de transformación adicionales
Añadir una transformación
Se pueden añadir transformaciones adicionales a un Pipeline haciendo clic en los signos verdes más a la derecha o a la izquierda de una transformación existente. Al hacer clic en el signo más a la izquierda o a la derecha de una transformación existente, se añade una nueva transformación antes o después de ella, respectivamente.
Copiar una transformación
Cualquier transformación existente en el Pipeline puede duplicarse haciendo clic en el icono de copia que se encuentra debajo de la transformación. Se crea una copia de la transformación y se abre el formulario de transformación. Actualice las entradas de la transformación según sea necesario y guarde la transformación copiada.
Borrar una transformación
Cualquier transformación de un Pipeline puede borrarse haciendo clic en el icono de la papelera situado bajo la transformación. Cuando se le pida que confirme la eliminación, escriba el texto necesario y haga clic en el botón Eliminar. Haga clic en el botón Atrás del formulario de confirmación para cancelar la eliminación.
Al eliminar una transformación que crea una nueva columna en el Pipeline, cualquier transformación posterior que utilice la columna creada por la transformación eliminada se marcará como no válida y el icono de transformación (círculo azul) se volverá rojo para indicar que la transformación ya no es válida.
Nota: Las transformaciones borradas no pueden restaurarse.
Reordenar transformaciones
El orden de las transformaciones puede cambiarse haciendo clic en las flechas izquierda y derecha bajo una transformación concreta. Al hacer clic en la flecha izquierda, la transformación se desplaza para que se produzca inmediatamente antes de la transformación que la precedía. La flecha de la derecha desplaza la transformación para que se produzca después de la transformación que le seguía anteriormente.