Desenvolvedor de Dados Senior
O candidato será responsável por liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes, trabalhando em parceria com stakeholders para refinar regras e requisitos.
A partir da modelagem de dados, especificação de regras de negócios e implementação dessas regras e tabelas no ambiente Databricks, o profissional irá unificar dados de pacientes provenientes de múltiplos sistemas de origem.
Pipeline de Processamento de Dados:
* Implementar pipelines de processamento de dados no Databricks;
* Criar lógicas para matching, deduplicação e golden record de pacientes.
Requisitos Técnicos:
* Experiência avançada com Python;
* Sólidos conhecimentos em: Databricks e Delta Lake, PySpark para processamento de dados em larga escala, SQL e modelagem de dados, ETL/ELT e pipelines de dados.
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros.
* Domínio de versionamento Git e metodologias ágeis.
Bônus:
* Conhecimento em FHIR ou outros padrões de dados de saúde.
* Experiência prévia com MDM na área de saúde.