Buscamos um especialista em dados para liderar projetos complexos
Estamos procurando por alguém com experiência avançada em Python para liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes.
O profissional irá trabalhar na modelagem de dados, especificação de regras de negócios e implementação dessas regras e tabelas no ambiente Databricks, unificando dados de pacientes provenientes de múltiplos sistemas de origem.
Responsabilidades e atribuições:
* Desenvolver e implementar a arquitetura de modelagem de dados do MDM de Pacientes
* Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes
* Implementar pipelines de processamento de dados no Databricks
* Desenvolver lógicas para matching, deduplicate e golden record de pacientes
* Estabelecer fluxos de qualidade de dados e validação
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas
* Implementar rotinas de atualização e sincronização de dados
* Participar de code reviews e mentoria técnica da equipe
* Colaborar com stakeholders de negócios para refinar regras e requisitos
Requisitos essenciais:
1. Experiência avançada com Python
2. Sólidos conhecimentos em:
3. Databricks e Delta Lake
4. PySpark para processamento de dados em larga escala
5. SQL e modelagem de dados
6. ETL/ELT e pipelines de dados
* Experiência com Master Data Management (MDM) ou projetos similares de integração de dados
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros
* Experiência com implementação de regras de negócios complexas em código
* Domínio de versionamento Git e metodologias ágeis
* Experiência com boas práticas de desenvolvimento (testes unitários, documentação)
Diferenciais:
* Experiência prévia com MDM na área de saúde
* Conhecimento em FHIR ou outros padrões de dados de saúde
* Experiência com Great Expectations para qualidade de dados
* Conhecimento em frameworks de governança de dados
* Experiência com mensageria (Kafka, Event Hubs)
* Familiaridade com ferramentas de CDC (Change Data Capture)
* Conhecimento em observabilidade (Databricks SQL Analytics, Grafana)
* Experiência com APIs RESTful para exposição de dados
Benefícios:
* Vale Alimentação ou Vale Refeição;
* Desconto em cursos, universidades e instituições de idiomas;
* Academia Stefanini - plataforma com cursos online, gratuitos, atualizados e com certificado;
* Mentoring;
* Auxílio Creche;
* Clube de vantagens para consultas e exames;
* Assistência Médica;
* Assistência Odontológica;
* Clube de vantagens e descontos nos melhores estabelecimentos;
* Clube de viagens;
* Convênio para Pet;
* e muito mais...