Aqui está uma oportunidade de se destacar como especialista em modelagem de dados. Somos procurados por profissionais com sólida experiência em Python, conhecimento em Databricks e Delta Lake, além de habilidades em PySpark para processamento de dados em larga escala.
Responsabilidades
* Desenvolver a arquitetura de modelagem de dados do MDM de Pacientes;
* Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes;
* Implementar pipelines de processamento de dados no Databricks;
* Desenvolver lógicas para matching, deduplicação e registro ouro de pacientes;
* Estabelecer fluxos de qualidade de dados e validação;
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
* Implementar rotinas de atualização e sincronização de dados;
* Participar de revisão de código e mentoria técnica da equipe;
* Colaborar com stakeholders de negócios para refinar regras e requisitos.
Requisitos Essenciais
* Experiência avançada com Python;
* Sólidos conhecimentos em Databricks e Delta Lake;
* Habilidades em PySpark para processamento de dados em larga escala;
* Conhecimento em SQL e modelagem de dados;
* ETL/ELT e pipelines de dados;
Diferenciais
* Experiência prévia com MDM na área de saúde;
* Conhecimento em FHIR ou outros padrões de dados de saúde;
* Experiência com Great Expectations para qualidade de dados;
* Conhecimento em frameworks de governança de dados;
* Experiência com mensageria (Kafka, Event Hubs);
* Familiaridade com ferramentas de CDC (Change Data Capture);
* Conhecimento em observabilidade (Databricks SQL Analytics, Grafana);
* Experiência com APIs RESTful para exposição de dados;
Benefícios
Vale Alimentação; Desconto em cursos; Academia Stefanini - plataforma com cursos online; Mentoring; Auxílio Creche; Clube de vantagens para consultas e exames; Assistência Médica; Assistência Odontológica; Clube de vantagens e descontos nos melhores estabelecimentos; Clube de viagens; Convênio para Pet;
],