Somos procurados por um Engenheiro de dados Sênior com sólida experiência em Python para liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes.
">
Resumo da Vaga
O candidato deve ter experiência avançada com Python, Databricks e Delta Lake, PySpark para processamento de dados em larga escala, SQL e modelagem de dados, ETL/ELT e pipelines de dados.
">
Responsabilidades
1. Desenvolver e implementar a arquitetura de modelagem de dados do MDM de Pacientes;
2. Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes;
3. Implementar pipelines de processamento de dados no Databricks;
4. Desenvolver lógicas para matching, deduplicação e registro-ouro de pacientes;
5. Estabelecer fluxos de qualidade de dados e validação;
6. Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
7. Implementar rotinas de atualização e sincronização de dados;
8. Participar de revisões de código e mentoria técnica da equipe;
9. Colaborar com stakeholders de negócios para refinar regras e requisitos;
Requisitos Técnicos
* Experiência avançada com Python;
* Databricks e Delta Lake;
* PySpark para processamento de dados em larga escala;
* SQL e modelagem de dados;
* ETL/ELT e pipelines de dados;
* Experiência com Master Data Management (MDM) ou projetos similares de integração de dados;
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros;
* Experiência com implementação de regras de negócios complexas em código;
* Domínio de versionamento Git e metodologias ágeis;
* Experiência com boas práticas de desenvolvimento (testes unitários, documentação).