Buscamos um profissional experiente para liderar o desenvolvimento de um Master Data Management (MDM) de Pacientes.
A posição visa unificar dados de pacientes provenientes de múltiplos sistemas de origem, com foco em soluções escaláveis e eficientes.
O ideal é ter sólida experiência em Python, Databricks e Delta Lake, além de conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros.
Será responsável por desenvolver a arquitetura de modelagem de dados do MDM de Pacientes, especificar e documentar regras de negócios, implementar pipelines de processamento de dados no Databricks e estabelecer fluxos de qualidade de dados e validação.
Responsabilidades:
* Desenvolver e implementar a arquitetura de modelagem de dados do MDM de Pacientes
* Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes
* Implementar pipelines de processamento de dados no Databricks
* Desenvolver lógicas para matching, deduplicate e golden record de pacientes
* Estabelecer fluxos de qualidade de dados e validação
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas
* Implementar rotinas de atualização e sincronização de dados
Requisitos Técnicos:
* Experiência avançada com Python
* Databricks e Delta Lake
* PySpark para processamento de dados em larga escala
* SQL e modelagem de dados
* ETL/ELT e pipelines de dados