Engenheiro de Dados Sênior - Arquiteto de Dados
Buscamos um profissional experiente para liderar o desenvolvimento e implementação de um Master Data Management (MDM) de Pacientes. Este projeto envolve a modelagem de dados, especificação de regras de negócios e implementação dessas regras e tabelas no ambiente Databricks.
Ao trabalhar em equipe, você estará responsável por:
* Desenvolver e implementar a arquitetura de modelagem de dados do MDM de Pacientes;
* Especificar e documentar regras de negócios para unificação e tratamento de dados de pacientes;
* Implementar pipelines de processamento de dados no Databricks;
* Desenvolver lógicas para matching, deduplicate e golden record de pacientes;
* Estabelecer fluxos de qualidade de dados e validação;
* Criar e manter tabelas integradas seguindo as regras de negócios estabelecidas;
* Implementar rotinas de atualização e sincronização de dados;
* Participar de code reviews e mentoria técnica da equipe;
* Colaborar com stakeholders de negócios para refinar regras e requisitos.
Requisitos Técnicos
O ideal seria que você tivesse:
* Experiência avançada com Python;
* Sólidos conhecimentos em: Databricks e Delta Lake, PySpark para processamento de dados em larga escala, SQL e modelagem de dados, ETL/ELT e pipelines de dados;
* Experiência com Master Data Management (MDM) ou projetos similares de integração de dados;
* Conhecimento em técnicas de matching, fuzzy matching e deduplicação de registros;
* Experiência com implementação de regras de negócios complexas em código;
* Domínio de versionamento Git e metodologias ágeis;
* Experiência com boas práticas de desenvolvimento (testes unitários, documentação).
Competências Desejáveis
E se você também:
* Tiver experiência prévia com MDM na área de saúde;
* Conhecesse FHIR ou outros padrões de dados de saúde;
* Tivesse experiência com Great Expectations para qualidade de dados;
* Conhecesse frameworks de governança de dados;
* Tivesse experiência com mensageria (Kafka, Event Hubs);
* Fosse familiarizado com ferramentas de CDC (Change Data Capture);
* Conhecesse observabilidade (Databricks SQL Analytics, Grafana);
* Tivesse experiência com APIs RESTful para exposição de dados?