Em uma era de transformação digital, buscamos um profissional experiente para liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes. O objetivo é criar uma arquitetura robusta de modelagem de dados que unifique informações de pacientes provenientes de múltiplos sistemas de origem.
O MDM de Pacientes terá como responsabilidade garantir a integridade e consistência dos dados, além de fornecer insights valiosos para tomada de decisões informadas.
Responsabilidades
1. Desenvolver e implementar a arquitetura de modelagem de dados do MDM de Pacientes;
2. Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes;
3. Implementar pipelines de processamento de dados no Databricks;
4. Desenvolver lógicas para matching, deduplicação e registro ouro de pacientes;
5. Estabelecer fluxos de qualidade de dados e validação;
6. Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
7. Implementar rotinas de atualização e sincronização de dados;
8. Participar de revisão de código e mentoria técnica da equipe;
9. Colaborar com stakeholders de negócios para refinar regras e requisitos;
Requisitos Técnicos
Os candidatos devem possuir experiência avançada em Python, juntamente com sólidos conhecimentos em Databricks e Delta Lake, PySpark para processamento de dados em larga escala, SQL e modelagem de dados, ETL/ELT e pipelines de dados.
Ao longo da carreira, é esperado que o profissional tenha experiência com Master Data Management (MDM) ou projetos similares de integração de dados, conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros, e experiência em implementar regras de negócios complexas em código.
Tecnologias
* Databricks;
* Pyspark;
* SQL;
* ETL/ELT;
* Pipelines de dados;
* Git;
* Métodos ágeis;
O profissional deve ter domínio em boas práticas de desenvolvimento, incluindo testes unitários e documentação de código.