Buscamos um profissional experiente para liderar o desenvolvimento de soluções de dados avançadas.
Responsabilidades e atribuições incluem:
* Desenvolver e implementar a arquitetura de modelagem de dados para unificar dados de pacientes provenientes de múltiplos sistemas de origem;
* Especificar e documentar regras de negócios para tratamento de dados de pacientes;
* Implementar pipelines de processamento de dados no Databricks;
* Desenvolver lógicas para matching, deduplicação e criação de registros únicos;
* Estabelecer fluxos de qualidade de dados e validação;
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
* Implementar rotinas de atualização e sincronização de dados;
* Participar de revisões de código e mentoria técnica da equipe;
* Colaborar com stakeholders de negócios para refinar regras e requisitos;
Requisitos essenciais:
1. Experiência avançada em Python;
2. Conhecimento sólido em Databricks e Delta Lake;
3. Familiaridade com PySpark para processamento de dados em larga escala;
4. Conhecimento de SQL e modelagem de dados;
5. ETL/ELT e pipelines de dados;
* Experiência com Master Data Management (MDM) ou projetos similares de integração de dados;
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros;
* Experiência com implementação de regras de negócios complexas em código;
* Domínio de versionamento Git e metodologias ágeis;
* Experiência com boas práticas de desenvolvimento (testes unitários, documentação);
Benefícios:
* Vale alimentação ou vale refeição;
* Desconto em cursos e instituições de idiomas;
* Assistência médica e odontológica;
* Clube de viagens;
* Convênio para pets;