En esta Ruta de aprendizaje conectada, tomaremos un extracto de datos de un sistema y realizaremos una serie de transformaciones para preparar el archivo de datos para cargarlo en otro sistema.
| Objetivo principal de aprendizaje | Para destacar algunos de los sencillos pero potentes comandos del Conector de transformación tabular que pueden utilizarse para resolver necesidades comunes de transformación |
| Requisitos previos | Configura HTTP, Utilidades de archivos, y Transformación tabular Conexiones de conectores. |
| Plantilla de Cadenas de Apoyo | CLP | Transformaciones tabulares |
Paso 1: Crea una Cadena
- Añade una nueva cadena
- Ponle Nombre a la Cadena: CLP | Transformaciones tabulares
- Crear una variable de cadena
- Nombre: cv-TT-SampleData
- Valor: https://cs-sftp-training-bucket.s3.amazonaws.com/cs-training/transformation-qs/sample.txt
- Guardar la cadena
Etapa 2: Recuperar datos de un sistema de origen
Utiliza el Conector HTTP para ilustrar cómo recuperar datos de un origen de datos para el que no existe un Conector Workiva.
- Añade un comando OBTENER desde el conector HTTP al nodo Inicio
- Configura el comando con lo siguiente:
Etapa 3: Actualiza los Encabezados del Fichero de Datos.
Actualiza los encabezados del fichero para que coincidan con los nombres de los campos del sistema al que se cargará el fichero de datos una vez finalizadas las transformaciones. El comando Asignar Encabezados nos permite actualizar el nombre del campo basándonos en el índice, lo que permite que el comando sea más flexible en caso de que el nombre de un campo cambie en el futuro.
- Agregar un comando Encabezados de mapa desde el conector de transformación tabular a la cadena.
- Conecta el nodo Inicio (HTTP - Obtener datos del sistema de origen) al comando Encabezados del mapa
- Edita el comando:
- Pon nombre al comando: Asignar Encabezados
- Haz clic en el parámetro Archivo de entrada. Se abre el panel de selección Variable a la izquierda. En la sección Comando, despliega el comando Obtener - Datos del sistema de origen y selecciona la respuesta Resultado.
- Deja en blanco el parámetro Archivo de salida.
- Marca la casilla Vista previa de resultados
- Deja el Delimitador como Coma ya que el archivo de datos del sistema de origen está delimitado por comas.
- En el parámetro Encabezados de Entrada, introduce números del cero (0) al siete (7), ya que el archivo tiene ocho campos y las listas son de base cero. ¡Asegúrate de pulsar la tecla Intro después de escribir cada número!
- Marca la casilla Utilizar índices. Esto indica al Comando que los Encabezados de Entrada se basan en la posición en el archivo y no en el nombre real de la columna.
- En los Encabezados de salida, especifica el nombre de los nuevos Campos que se van a crear. El orden importa, ya que la primera entrada de la lista sustituirá al nombre de cabecera del primer campo del archivo del sistema fuente, y así sucesivamente para cada una de las entradas restantes. Escribe los siguientes Encabezados y pulsa la tecla Intro después de cada uno:
- Producto
- Mercado
- Mes
- Escenario
- Ventas
- ENGRANAJES
- Gastos
- Ingresos de explotación
- Guardar el comando
Etapa 4: Desplazar columnas de datos a filas
A continuación, actualiza el archivo de datos para transponer las múltiples columnas de datos en filas y crear una única columna de datos. Esta operación se denomina "despivotar". La operación de desagrupar alinea los datos en el formato esperado, una sola columna que contiene todos los datos, del sistema descendente.
- Añade a la cadena un comando Sin girar desde el Conector de transformación tabular
- Conecta el comando Encabezados de mapa con el comando Unpivot.
- Edita el comando
- Ponle Nombre al Comando: Desplazar - Mover medidas a filas
- Selecciona Resultado de encabezados de mapa para el parámetro Archivo de entrada
- El Resultado de los Encabezados del Mapa sigue estando delimitado por comas, así que dejamos el Delimitador como Coma
- En el parámetro Agregación, selecciona Suma. Si eliges Suma, las filas resultantes creadas por la desagrupación que sean iguales en todas las columnas agregarán los valores de los datos a un único punto de datos.
- En el parámetro Nueva Etiqueta de Columna, introduce Medidas. Este es el Encabezado de la nueva columna que se creará y rellenará con los valores de encabezado de las columnas que se desvoquen.
- En el parámetro Etiqueta de columna de datos, introduce Importe
- Los campos Encabezados de datos, Nombre inicial de columna pivotante, Nombre final de columna pivotante, Índice inicial de columna pivotante, y Índice final de columna pivotante se utilizan para realizar la operación de pivotado. No es necesario especificar todos estos parámetros.
- Si utilizas el parámetro Encabezados de datos, el resto de parámetros deben dejarse en blanco. El parámetro Encabezados de datos permite especificar el nombre de las columnas. Este parámetro es útil para los Campos que no son concurrentes/laterales.
- Los parámetros Nombre de la columna inicial/final permiten especificar el nombre de la primera y la última columna (para un rango concurrente). Si utilizas estos parámetros, el parámetro Encabezados de datos, así como el índice Columna inicial/columna final deben dejarse en blanco. Si el Nombre de la columna final se deja en blanco, la desagrupación se realizará para todos los campos posteriores (e incluidos) al Nombre de la columna inicial.
- Los parámetros Índice de columnas inicial/final permiten especificar la posición de la primera y la última columna (para un rango concurrente). Si utilizas estos parámetros, el parámetro Encabezados de datos así como el Nombre de columna inicial/final deben dejarse en blanco. Si el Índice de columna final se deja en blanco, la desagrupación se realizará para todos los Campos posteriores (e incluidos) al Índice de columna inicial. Utilizamos estos parámetros en este ejercicio.
- En el índice de columna pivotante de inicio , introduce 4. Esto indica al comando que pivote a partir de la quinta columna, ya que el índice es cero.
- Deja en blanco la columna pivotante Finalizar índice.
- Comprueba la opción Vista previa de los resultados
- Guardar el comando
Etapa 5: Actualiza el Escenario
A continuación, cambia el nombre del escenario. Esto ilustra una transformación sencilla y puntual que se presta bien a Integration Studio. Las transformaciones de cambio de nombre más extensas o complejas se agilizan considerablemente con Preparación de los datos.
- Añadir un comando Buscar y reemplazar desde el Conector de transformación tabular a la cadena.
- Conecta el comando Unpivot al comando Buscar y reemplazar.
- Edita el comando:
- Pon nombre al comando: Buscar y reemplazar - Reemplazar por...
- En el parámetro Archivo de entrada, selecciona el Resultado pivotado Resultado del comando Unpivotar.
- Deja en blanco el parámetro Archivo de salida.
- Marca la casilla Vista previa de resultados
- El archivo no dividido sigue estando delimitado por comas, así que especifica el Delimitador como Coma.
- Vamos a buscar el texto Presupuesto y a reemplazarlo por el texto Plan. En el parámetro Buscar en patrón, introduce Presupuesto.
- En el parámetro Match Pattern Value, selecciona Exacto .
- Exacto significa que buscamos el texto completo especificado en los parámetros del patrón Buscar. Para buscar subcadenas o comodines, tendríamos que utilizar el tipo de patrón Expresión regular (regex).
- En el parámetro Valor de reemplazo, introduce Plan. Cualquier caso del texto Presupuesto será reemplazado por el texto Plan.
- El parámetro Reemplazar solo las coincidencias no es aplicable a las coincidencias exactas y puede dejarse desmarcado, ya que es el valor predeterminado.
- Deja sin marcar la opción que no distingue entre mayúsculas y minúsculas. Al hacerlo: la operación Buscar y reemplazar distingue entre mayúsculas y minúsculas, de modo que Presupuesto se reemplazará por Plan pero no por presupuesto .
- La columna Escenario donde se encuentra el patrón Buscar (Presupuesto) en la cuarta columna. En el parámetro Columnas, introduce un tres (3) numérico, ya que el parámetro tiene base cero.
- Guardar el comando
Etapa 6: Mantén solo los datos del Plan de Nueva York
A continuación, conserva solo el plan de Nueva York utilizando el comando Filtrado inteligente. Este Filtro Inteligente nos permite especificar condiciones basadas en los datos que se utilizarán para mantener o eliminar determinadas filas del conjunto de datos.
- Añade un comando Filas de filtrado inteligente desde el Conector de transformación tabular a la cadena
- Conecta el comando Filas de filtrado inteligente al comando Buscar y reemplazar
- Edita el comando:
- Pon nombre al comando: Filtrar Filas Inteligentes - Solo Plan Nueva York
- En el parámetro Archivo de entrada, selecciona Resultado de buscar y reemplazar del comando Buscar y reemplazar
- Deja en blanco el parámetro Archivo de salida.
- Especifica Coma como Delimitador
- En la sección Filtros, existe la posibilidad de filtrar Texto, Número, y Fecha. Se pueden especificar múltiples condiciones de filtrado. Si aplicas filtros a distintos tipos (Texto, Número, Fecha), debes especificar en consecuencia el Operador de la parte superior izquierda. Si se aplican varias condiciones dentro de un tipo determinado (por ejemplo, Texto), hay que especificar el Operador para ese tipo de filtro.
- En este ejercicio, aplicaremos filtros basados en texto para que el Operador global sea Y o O.
- Si es necesario, establece el Operador general en AND
- Haz clic en el botón Añadir en los filtros Texto
- En el parámetro Nombre de la columna, introduce Escenario
- Desmarca la opción No distingue mayúsculas de minúsculas
- Desde el desplegable Condición, selecciona Es igual que .
- En el parámetro Comparar texto, introduce Actual
- Deja sin marcar las casillas No está en y Recorta
- Este filtro se utilizará para eliminar cualquier registro en el que el campo Escenario contenga un valor Actual
- Haz clic de nuevo en el botón Añadir en la sección Filtros de texto.
- Establece el operador de filtros Texto como OR
- Selecciona la combinación O para filtrar tanto Actual como Nueva York.
- En la segunda condición, especifica Mercado como Nombre de la columna
- Establece la condición en Es igual que ?
- Especifica el texto de comparación como Nueva York
- Por último, marca la opción No
- Establece el operador de filtros Texto como OR
- Deja Comprobada la opción Vista previa del resultado
- Si es necesario, establece el Operador general en AND
- En este ejercicio, aplicaremos filtros basados en texto para que el Operador global sea Y o O.
- La opción Invertir permite que el Filtro inteligente mantenga (marcado) o elimine (sin marcar) todas las filas que coincidan con los criterios de filtrado. En este ejercicio, queremos quitar todas las filas en las que el Escenario sea igual a Actual o el Mercado no sea igual a Nueva York. Para ello, se desmarca la opción Invertir.
- Guardar el comando
Etapa 7: Añadir una columna de Año
Por último, añade una columna adicional al conjunto de datos para indicar el Año de los datos.
- Añadir un comando Insertar columna desde el conector de transformación tabular a la cadena
- Conecta el comando Insertar columna al comando Filtrar filas inteligente.
- Edita el comando y configura con lo siguiente:
| Nombre | Insertar columna - Año del plan |
| Archivo de Entrada | Resultado de filas de filtrado inteligente |
| Archivo de Salida | <leave> |
| Vista previa Resultados | Comprobado |
| Deliimitador | Coma |
| Texto Encabezados | Año |
| Datos Valor | 2022 |
| Insertar índice | 3 |
- Guardar el comando
Etapa 8: Evaluar el ejercicio
Ahora que la Cadena está completa, evalúa el resultado.
- Publicar en la Cadena
- Haz clic en Ejecutar y, a continuación, selecciona Ejecutar cadena.
- Una vez completada la Cadena, haz clic en el nodo Insertar columna - Planificar año
- En la pestaña Resultados, confirma que ha salido 385 Registros.
- Haz clic en la pestaña Registros y confirma los datos según la siguiente imagen
Pestaña de Resultados
Pestaña Registros
Para obtener más información sobre la transformación de datos mediante Cadenas, consulta Rutas de aprendizaje conectadas - Introducción a la transformación.