Una canalización puede aplicar distintos tipos de transformaciones, en función de cómo desee afectar a los datos tabulares. Cada Pipeline requiere al menos una (1) transformación y se le puede asignar un número prácticamente ilimitado de transformaciones.
Nota: Cuando configure una transformación que utilice un operador de comparación, como contiene
, mayor que
, es igual (=
), o no es igual (!=
), pulse INTRO después de su valor.
Estas transformaciones se agrupan en cuatro (4) categorías:
- Transformar (transformaciones técnicas): modificar la disposición de los datos de la carga útil.
- Filtrar - Quitar filas de la carga útil de datos basándose en un criterio/criterio.
- Datos - Ordene los datos por campos específicos y aplique la suma para obtener puntos de datos.
- Mapeo (Transformaciones Funcionales) - construye relaciones entre campos de datos.
Añadir transformaciones a un Pipeline es un proceso muy guiado, pero no prescriptivo. Esto garantiza la máxima flexibilidad para responder a sus necesidades de transformación.
Nota: Antes de añadir transformaciones a su Pipeline, asegúrese de fijar un Archivo de ejemplo.
Requisitos
Data Prep se controla totalmente a nivel de organización y no reconoce los espacios de trabajo individuales ni sus permisos.
Es decir:
- Data Prep se comparte entre todos los usuarios autorizados en su org.
- Cualquier usuario con acceso a Chain Builder también tiene acceso a Data Prep.
- Todos los usuarios que puedan crear o editar cadenas tendrán la posibilidad de gestionar canalizaciones en Data Prep.
- Una única canalización de preparación de datos puede utilizarse en varias cadenas y espacios de trabajo de una organización.
Transformar
Para modificar el diseño de los datos tabulares, por ejemplo para Agregar o Quitar Columnas o ajustar sus valores, añada una transformación Transform .
Nota: Al agregar una columna, se especifica su nombre, el tipo y formato de sus valores y dónde debe aparecer en los datos tabulares.
Transformación | Descripción |
---|---|
Insertar columna | Agrega un campo al conjunto de datos con un valor en cada fila. Cuando configure esta transformación, especifique el valor estático o variable de las columnas. |
Insertar números de fila | Agregar una columna con numeración de filas al conjunto de datos. Cuando configure esta transformación, especifique el número inicial de las filas. |
Fórmula Excel | Agrega una columna con el resultado de una operación realizada en columnas especificadas, basándose en una fórmula de Microsoft Excel®. Cuando configure esta transformación, especifique la fórmula a realizar. Cuando escriba la fórmula, refiérase a las columnas por sus Encabezados, como SUM(importe1, importe 2) . Nota: Al contrario que en Excel, no comienza con un operador |
Quitar Columnas | Quita las columnas especificadas del conjunto de datos |
Fusionar columnas | Agregar una columna con los valores combinados de las columnas especificadas, separadas por un delimitador especificado. |
Cambiar nombre | Cambia el nombre de las columnas especificadas en el conjunto de datos. |
Columna de desplazamiento | Reposiciona una columna especificada dentro del conjunto de datos |
Dividir valor de campo. | Divide los valores de una columna en varias columnas, basándose en un delimitador especificado. |
Mantener columnas | Quita todas las columnas del conjunto de datos excepto las especificadas |
Cartel | Invierte el signo de los valores de una columna especificada, por ejemplo de positivo a negativo, o viceversa. |
Mayúsculas | Convierte los valores de una columna especificada a todas las MAYÚSCULAS. |
Minúsculas | Convierte los valores de una columna especificada a todas las minúsculas. |
Buscar y reemplazar texto | Reemplaza todas las instancias de un valor de Texto especificado en el conjunto de datos por un nuevo valor especificado. |
Grupos por | Agrega el conjunto de datos en registros únicos basados en columnas especificadas, de forma similar a a GROUP BY sentencia SQL. |
Copiar columna | Agregar un duplicado de una columna especificada |
Cadena de distancia | Calcula el número de ediciones (es decir, la "distancia") necesarias para convertir una cadena de texto en la otra. También conocida como transformación de distancia Levenshtein. Cada cadena está limitada a un máximo de 1024 caracteres; se calcula una distancia máxima de 100. |
Sugerencia: Para quitar filas de un conjunto de datos, utilice una palabra clave -como Ignorar
- para indicar las filas que desea quitar. A continuación, utilice la palabra clave como un valor de A en una transformación de Mapeo , y configure una transformación Filtro inteligente con una condición O para quitar cualquier campo mapeado con esa palabra clave.
Filtrar
Para Quitar Filas de los datos basándose en criterios específicos, Agregue una transformación Filtrar .
Transformación | Descripción |
---|---|
Coincidencia exacta | Quita todas las Filas que no coinciden exactamente con el Texto especificado. |
Coincidencia RegExp | Quita todas las Filas que no coinciden con la expresión regular especificada (RegExp) |
Toma Filas | Quita todas las Filas a partir del número especificado. Por ejemplo, 10: quita la décima Fila y todas las siguientes. |
Filtro inteligente | Quita o conserva los registros de una columna en función de las condiciones especificadas. |
Datos
Para ordenar datos tabulares o aplicar sumas basadas en columnas específicas, agregue una transformación Data .
Transformación | Descripción |
---|---|
Ordenar | Ordena el conjunto de datos en función de las columnas especificadas |
Suma si | Crea una salida de canalización adicional con la suma de todos los valores en una columna especificada. |
Cartografía
Para transformar los valores de una columna basándose en las reglas definidas por un grupo de mapeo, agregue una transformación Mapeo :
- Seleccione Mapping, y haga clic en Siguiente.
- Seleccione el grupo de asignación con las reglas a aplicar.
- En Columnas coincidentes, seleccione qué columnas de la canalización coinciden con las del grupo de asignación.
- Haz clic en Guardar.
Si aplica varias transformaciones de Mapping a una columna, asegúrese de que están en el orden correcto dentro de la canalización.
Sugerencia: Cuando una canalización aplica una transformación Mapping , transforma los valores de la columna en línea. Para ver los valores de una columna antes y después de la transformación al mismo tiempo, aplique una transformación Copiar columna para añadir un duplicado de la columna antes de la transformación Asignación . Para indicar el estado "antes" de los valores de la copia, añada un prefijo a su nombre, como Src_
o UM_
, para Origen o No mapeado, respectivamente. Para Quitar posteriormente esta columna del conjunto de datos, aplique una transformación Agrupar por o Quitar columnas .
Funciones de transformación adicionales
Agregar una transformación
Se pueden Agregar transformaciones adicionales a un Pipeline haciendo clic en los signos verdes más a la derecha o a la izquierda de una transformación existente. Al hacer clic en el signo más a la izquierda o a la derecha de una transformación existente, se añade una nueva transformación antes o después de ella, respectivamente.
Copiar una transformación
Cualquier transformación existente en el Pipeline puede duplicarse haciendo clic en el icono de copia que se encuentra bajo la transformación. Se crea una copia de la transformación y se abre el formulario de transformación. Actualice las entradas de transformación según sea necesario y guarde la transformación copiada.
Eliminar una transformación
Cualquier transformación en un Pipeline puede ser eliminada haciendo clic en el icono de la papelera bajo la transformación. Cuando se le pida que confirme la eliminación, escriba el texto deseado y haga clic en el botón Eliminar. Haga clic en el botón Atrás del formulario de confirmación para cancelar la eliminación.
Al eliminar una transformación que crea una nueva columna en la canalización, cualquier transformación posterior que utilice la columna creada por la transformación eliminada se marcará como no válida y el icono de transformación (círculo azul) se volverá rojo para indicar que la transformación ya no es válida.
Nota: Las transformaciones eliminadas no se pueden restaurar.
Reordenar transformaciones
El orden de las transformaciones puede cambiarse haciendo clic en las flechas Izquierda y Derecha situadas bajo una transformación concreta. Al hacer clic en la flecha de la izquierda, la transformación se desplaza para producirse inmediatamente antes de la transformación que la precedía. La Flecha Derecha desplaza la transformación para que se produzca después de la transformación que le seguía anteriormente.