Requisitos para uma posição de liderança em Desenvolvimento de Dados incluem experiência avançada com Python e sólidos conhecimentos em Databricks e Delta Lake, PySpark, SQL e modelagem de dados. O profissional deve ter habilidade em ETL/ELT e pipelines de dados, além de experiência com Master Data Management (MDM) ou projetos similares de integração de dados.
O ideal é que o candidato tenha conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros, bem como experiência em implementação de regras de negócios complexas em código. Além disso, domínio de versionamento Git e metodologias ágeis são fundamentais para o sucesso nessa função.
Ao assumir essa posição, você estará responsável por liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes. Isso envolve a modelagem de dados, especificação de regras de negócios e implementação dessas regras e tabelas no ambiente Databricks, unificando dados de pacientes provenientes de múltiplos sistemas de origem.
O projeto exige habilidade em criar e manter tabelas integradas seguindo as regras de negócios estabelecidas, implementar rotinas de atualização e sincronização de dados, participar de code reviews e mentoria técnica da equipe, além de colaborar com stakeholders de negócios para refinar regras e requisitos.
Requisitos Técnicos:
* Experiência avançada com Python;
* Sólidos conhecimentos em Databricks e Delta Lake, PySpark, SQL e modelagem de dados;
* Habilidade em ETL/ELT e pipelines de dados;
* Experiência com Master Data Management (MDM) ou projetos similares de integração de dados;
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros;
* Experiência em implementação de regras de negócios complexas em código;
* Domínio de versionamento Git e metodologias ágeis.