**Descrição do Cargo**
O Engenheiro de dados Sênior é um profissional experiente em Python, responsável por liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes.
A principal responsabilidade desse cargo é trabalhar na modelagem de dados, especificação de regras de negócios e implementação dessas regras e tabelas no ambiente Databricks, unificando dados de pacientes provenientes de múltiplos sistemas de origem.
O profissional precisa ter sólida experiência em:
* Databricks e Delta Lake;
* Pyspark para processamento de dados em larga escala;
* SQL e modelagem de dados;
* ETL/ELT e pipelines de dados;
E além disso, deve possuir conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros, assim como experiência com implementação de regras de negócios complexas em código.
Também é necessário ter domínio de versionamento Git e metodologias ágeis, bem como experiência com boas práticas de desenvolvimento (testes unitários, documentação).
Outros requisitos incluem:
* Experiência prévia com MDM na área de saúde;
* Conhecimento em FHIR ou outros padrões de dados de saúde;
* Experiência com Great Expectations para qualidade de dados;
* Conhecimento em frameworks de governança de dados;
* Experiência com mensageria (Kafka, Event Hubs);
* Familiaridade com ferramentas de CDC (Change Data Capture);
* Conhecimento em observabilidade (Databricks SQL Analytics, Grafana);
* Experiência com APIs RESTful para exposição de dados.
Esse profissional será fundamental para a resolução de problemas de negócios, proporcionando impacto real em escala global, através da criação de soluções inovadoras em parceria com os clientes.
A empresa busca um profissional que valoriza inovação, respeito, autonomia e parceria, alinhado com os princípios da empresa.