Agregue valor à nossa equipe como Engenheiro de Dados Sênior, liderando projetos inovadores e desafiadores.
Desenvolva uma arquitetura de modelagem de dados robusta para um Master Data Management (MDM) de Pacientes, garantindo unificação e tratamento de dados de pacientes em larga escala.
Responsabilidades
* Desenvolver pipelines de processamento de dados no Databricks;
* Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes;
* Implementar lógicas para matching, deduplicação e registros de paciente golden;
* Estabelecer fluxos de qualidade de dados e validação;
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
* Implementar rotinas de atualização e sincronização de dados;
A perfeição é o nosso objetivo. Mantenha os padrões de desenvolvimento elevados, com boas práticas como testes unitários e documentação rigorosa.
Requisitos
Experiência avançada com Python, Databricks e Delta Lake; sólidos conhecimentos em PySpark para processamento de dados em larga escala, SQL e modelagem de dados; além de experiência em ETL/ELT e pipelines de dados.
Se você busca um desafio que exija suas habilidades técnicas, ofereça soluções inovadoras e trabalhe em colaboração com stakeholders de negócios, somos a sua equipe.