Se você busca uma oportunidade de crescimento profissional em um ambiente de inovação, comprometimento com a excelência e respeito mútuo, este é o cargo para você.
Fundamentos da Vaga
O Engenheiro de Dados Sênior será responsável por liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes.
Desenvolverá arquiteturas de modelagem de dados do MDM de Pacientes;
Especificará e documentará regras de negócios para unificação e tratamento de dados de pacientes;
Implementará pipelines de processamento de dados no Databricks;
Desenvolverá lógicas para matching, deduplicação e golden record de pacientes;
Estabelecerá fluxos de qualidade de dados e validação;
Criará e manterá tabelas integradas seguindo as regras de negócios estabelecidas;
Implementará rotinas de atualização e sincronização de dados;
e participará de code reviews e mentoria técnica da equipe.
Requisitos Técnicos
Essenciais:
* Experiência avançada com Python;
* Sólidos conhecimentos em: Databricks e Delta Lake;
* PySpark para processamento de dados em larga escala;
* SQL e modelagem de dados;
* ETL/ELT e pipelines de dados;
* Experiência com Master Data Management (MDM) ou projetos similares de integração de dados;
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros;
* Experiência com implementação de regras de negócios complexas em código;
* Dominio de versionamento Git e metodologias ágeis;
* Experiência com boas práticas de desenvolvimento (testes unitários, documentação).
Diferenciais:
* Experiência prévia com MDM na área de saúde;
* Conhecimento em FHIR ou outros padrões de dados de saúde;
* Experiência com Great Expectations para qualidade de dados;
* Conhecimento em frameworks de governança de dados;
* Experiência com mensageria (Kafka, Event Hubs);
* Familiaridade com ferramentas de CDC (Change Data Capture);
* Conhecimento em observabilidade (Databricks SQL Analytics, Grafana);
* Experiência com APIs RESTful para exposição de dados.