Molinos Río de la Plata

De lo manual a lo automático:
el proceso de extracción de datos de Molinos Río de la Plata

Logo Molinos

DinoCloud, una compañía cloud-first y partner Premier de AWS, cuenta con recursos y expertise técnica de vanguardia para llevar a cabo proyectos que acompañan a empresas de diversa índole en su camino hacia la transformación digital y la automatización de procesos en la nube. Molinos Río de la Plata es una compañía líder en la producción de alimentos y bebidas de Argentina y es cliente de DinoCloud desde diciembre de 2021.

Nuestra relación laboral nació de un proyecto de facturación local, que es otra de las ramas de especialización de DinoCloud. Debido a la buena relación interpersonal y profesional generada en este proyecto, Molinos Río de la Plata se comunicó con el área comercial de DinoCloud para abordar otra necesidad: la automatización de los procesos de extracción de datos del programa Precios Claros. Este programa busca lograr la equidad competitiva mediante la exhibición del valor comercial de los productos elaborados por la competencia en el mercado de los alimentos.

Antes de empezar con este proyecto, Molinos Río de la Plata utilizaba un script de PowerShell para extraer manualmente los datos de Precios Claros y cargarlos en una base de datos SQl Server. Este proceso manual suponía una gran desventaja operativa ya que no solamente obstaculizaba lograr la alta disponibilidad de los datos para la toma estratégica de decisiones, sino que también aumentaba la posibilidad de errores en la lectura y extracción de datos.
A raíz de esta necesidad, DinoCloud le llevó a Molinos Río de la Plata un proyecto cuyo objetivo principal era la realización de un Data Lake automático para la extracción y transformación de los datos del programa Precios Claros. Este proyecto fue pensado para durar un mes con tres épicas.

Discovery, infraestructura, y migración

El proyecto de automatización de los procesos de extracción de datos del programa Precios Claros se llevó a cabo en tres épicas diferentes:

Discovery

Esta etapa consistió en entender el procesos que estaba realizando el cliente y se hicieron dos reuniones junto al cliente para captar correctamente las necesidades a abordar.

Armado de la infraestructura para el procesamiento

La principal tarea de esta épica fue armar el workflow en AWS Glue para automatizar el procesamiento. Para esto, se configuraron los roles y gestionaron las claves con el servicio de AWS IAM, se crearon y configuraron buckets de AWS S3 y se crearon jobs en AWS Glue. Además se desarrollaron los pipelines ETL sobre AWS Glue y se armó la arquitectura de datos en Amazon Redshift para dar soporte a las consultas necesarias para los reportes en PowerBI. Esta etapa culminó con el workflow terminado.

Migración del procesos de scraping a AWS

Una vez creada la arquitectura era necesario realizar la migración del proceso de scraping, que se realizó con éxito.

Resultados integrales del proyecto

Los resultados del proyecto fueron la automatización del proceso de extracción, la transformación y el cargado de datos, lo que logró una sustancial reducción de tiempos operativos y la posibilidad de errores por trabajo manual. 

Además, se logró capacitar al personal en herramientas de AWS que ellos desconocían y se los sumergió en el mundo cloud.  Durante 3 meses y una vez por semana, se realizaron sesiones de demostración de la metodología de trabajo y la transferencia de conocimiento. Por último, se realizó la documentación de todo el workflow para que el equipo de ingeniería de Molinos Río de la Plata acceda cuando lo necesite. 

La duración inicial del proyecto era de 1 mes, tiempo en el que se realizaron las tareas descriptas, aún así, el contrato se extendió en dos ocasiones. La primera renovación se llevó a cabo debido a la necesidad de seguir brindando soporte para la transferencia de conocimiento al personal de Molinos Río de la Plata. La segunda renovación se enmarcó en un cuadro de investigación e implementaciones para mejoras de los procesos. 

En cuanto a las mejoras de los procesos, los mismos fueron los siguientes:

Conclusión

El proyecto de DinoCloud con Molinos Río de la Plata fue un éxito y se logró la automatización del proceso de extracción de datos del programa Precios Claros, lo que permite tomar decisiones estratégicas más rápidamente en un mercado muy competitivo. Ahora, Molinos Río de la Plata está más involucrado en el mundo cloud y en la transformación digital gracias a la experiencia y expertise técnica de DinoCloud.

Formulario de contacto

(*) Campos obligatorios