Big Data & Cloud

Ingeniería de Datos aplicado a Health & Insurance

Descripción del proyecto

El cliente es una compañía de seguros privados de salud asociados a hospitales, centros médicos y especialistas por todo el país. Cuentan con un portal web que los clientes pueden utilizar para solicitar citas médicas y recibir los resultados de sus análisis e informes. El cliente quiere tener mayor visibilidad la forma en la que sus clientes utilizan sus seguros para determinar cuáles son las especialidades más demandadas, los centros más visitados, los análisis más frecuentes, las medicinas más recetadas, entre otros aspectos. Sin embargo, no cuenta con una infraestructura unificada donde se almacene toda esa información de manera estructurada para poder llevar a cabo tareas de analítica.

Desafío: Integrar en un sistema unificado y estructurado la información de citas, recetas, análisis y clientes aplicando las mejoras prácticas de Ingeniería de Datos

Ejecución

Solución: Creación de un Data Lake y un Data Warehouse en AWS que unifique todas las fuentes de información.

El proyecto comenzó auditando la infraestructura actual del cliente e identificando todas las fuentes de información y repositorios de datos. Se propuso el desarrollo de una infraestructura orientada al procesamiento masivo de datos siguiendo el paradigma ELT (Extract Load Transform) utilizando servicios de AWS como Glue, S3, Step Functions y Redshift.

Inicialmente, se generó un prototipo capaz de consultar la base de datos de clientes y el historial de citas médicas. Esta información se escribía sin ningún tipo de transformación el Data Lake de S3 y luego se procesaba por los jobs de Glue para llevar a cabo tareas de limpieza y normalización de datos. A continuación, se generó un modelado de datos sencillo, se subió la información a Redshift (Data Warehouse) y se orquestó todo el proceso con Step Functions.

Una vez completado, se validaron los resultados con el cliente y se estimaron los costes de escalar el prototipo al resto de fuentes de información. Tras el éxito del prototipo, se tomó la decisión de escalar la arquitectura al resto de fuentes de datos internas de la compañía y externas de proveedores.

Para ello, se utilizó el CloudFormation como herramienta de infraestructura bajo código (IaS) y se iteró sobre el modelado de datos inicial para completarlo con los nuevos orígenes de datos. Se mantuvo una metodología incremental incorporando un grupo de fuentes a la ELT, validando los resultados y luego seleccionado un nuevo grupo.

Resultados del proyecto

Resultado: Se consiguen sentar las bases para llevar a cabo tareas de analítica avanzada sobre un Data Warehouse que unifica todos los orígenes de información.

Gracias a la creación del Data Warehouse de Redshift, el cliente cuenta con un punto único de análisis escalable, robusto y seguro. Esto deriva en múltiples mejoras operativas y de calidad del dato, evitando inconsistencias al trabajar con diferentes fuentes y facilitando el control de acceso a la información. Además de eso, abre las puertas a proyectos de innovación más avanzados como el desarrollo Dashboards de Business Intelligence o incorporar modelos de Inteligencia Artificial que permitan segmentar y categorizar a los clientes, orientar campañas de marketing y recomendar acciones específicas para cada cliente.

Listo para comenzar a trabajar junto a
Deep Wolf AI?

Lo que opinan nuestros clientes

John Carter
@johncarter
“Si quieres tener un producto estable y eficiente, te recomiendo trabajar con Deep Wolf AI. Los clientes pueden esperar un socio que sabe lo que hace.”
Andy Smith
@andysmith
“Su competencia en ciencia de datos y aprendizaje automático es insuperable. obtuvimos el mismo nivel de servicio que una empresa más grande que nosotros.”
Lily Woods
@lilywoods
“Pruébalos. No te decepcionarán. Los recomendaría a cualquiera.”
Sophie Moore
@sophiemoore
“El equipo de Deep Wolf AI piensa en ser un socio a largo plazo.”
Matt Cannon
@mattcannon
“Their drive was strong, and the whole team pushed their limits to meet deadlines and make everything work.”
Anne Meyer
@annemeyer
“Sin Deep Wolf AI no habríamos conseguido todos los datos exclusivos de las redes sociales que hoy ofrecemos a nuestros clientes.”

Centro de preferencias de privacidad

Necessary

Advertising

Analytics

Other