Responsabilidades e atribuições- Projetar, desenvolver e sustentar pipelines de dados escaláveis com foco em ingestão via CDC (Change Data Capture) utilizando Oracle GoldenGate;
- Configurar e administrar replicações de dados em tempo real e quase tempo real entre sistemas origem e ambientes cloud;
- Garantir consistência,integridade e sincronização dos dados entre origem e destino;
- Monitorar pipelines deingestão, atuar em troubleshooting e otimizar performance dos processos CDC;
- Suportar estratégias de carga full e incremental (delta load);
- Desenvolver e manter pipelines de processamento de dados utilizando Azure e Databricks (Spark);
- Implementar transformações seguindo arquitetura moderna de dados no modelo Bronze, Silver e Gold;
- Otimizar pipelines visando performance, escalabilidade e eficiência de custos;
- Trabalhar com dados estruturados e semiestruturados para consumo analítico, relatórios e iniciativas de IA/ML;
- Atuar em conjunto com arquitetos de dados na definição de arquiteturas modernas de Lakehouse;
- Apoiar iniciativas de governança, catálogo de dados, lineage e compliance;
- Garantir disponibilidade, confiabilidade, segurança e qualidade dos dados para consumo downstream.Requisitos e qualificações- Graduação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas;
- Experiência prática e sólida com Oracle GoldenGate em processos de ingestão de dados e CDC (Change Data Capture), incluindo replicação em tempo real e quase tempo real;
- Vivência no desenvolvimento, sustentação e otimização de pipelines de dados escaláveis e distribuídos;
- Experiência com ecossistema Microsoft Azure, incluindo Azure Data Factory, Azure Data Lake e Azure Data Lake Storage Gen2;
- Forte conhecimento em Databricks e processamento distribuído utilizando Spark;
- Experiência em arquiteturas modernas de dados, como Lakehouse, trabalhando com camadas Bronze, Silver e Gold;
- Vivência com cargas full e incrementais (delta load), garantindo integridade, consistência e sincronização dos dados;
- Conhecimento em monitoramento de pipelines, troubleshooting, tuning de performance e otimização de custos em ambientes cloud;
- Experiência com dados estruturados e semiestruturados voltados para analytics, reporting e iniciativas de IA/ML;
- Conhecimento em governança de dados, catálogo, lineage, segurança e boas práticas de arquitetura corporativa;
- Capacidade de atuar deforma colaborativa com arquitetos de dados, times analíticos e stakeholders de negócio.