Desenvolver soluções inovadoras em dados é fundamental para o crescimento de qualquer empresa. Nesse contexto, procuramos um profissional experiente em Pipelining de Dados e Master Data Management.
O candidato perfeito para este cargo será alguém que tenha experiência avançada com Python, conhecimentos sólidos em Databricks e Delta Lake, além de ter habilidades em PySpark para processamento de dados em larga escala. Além disso, devem ter experiência com ETL/ELT e pipelines de dados.
Aqui estão algumas das responsabilidades do cargo:
* Desenvolver e implementar a arquitetura de modelagem de dados do MDM de Pacientes;
* Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes;
* Implementar pipelines de processamento de dados no Databricks;
* Desenvolver lógicas para matching, deduplicação e golden record de pacientes;
* Estabelecer fluxos de qualidade de dados e validação;
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
* Implementar rotinas de atualização e sincronização de dados;
Além disso, também buscamos um profissional que tenha:
* Experiência prévia com MDM na área de saúde;
* Conhecimento em FHIR ou outros padrões de dados de saúde;
* Experiência com Great Expectations para qualidade de dados;
* Conhecimento em frameworks de governança de dados;
Nós valorizamos profissionais que sejam capazes de trabalhar em equipe, ter iniciativa e serem proativos em suas tarefas. Se você é um profissional apaixonado por tecnologia e deseja contribuir para o sucesso de uma empresa líder em dados, nós queremos ouvir de você!
Você precisará:
* Ter uma boa compreensão de conceitos como big data e ciência de dados;
* Ser capaz de trabalhar com equipes multidisciplinares;
* Possuir habilidades de comunicação eficazes;
* Ter experiência em ferramentas de versionamento de código e metodologias ágeis.