Engenheiro de Dados - Desenvolvimento de Pipelines Escaláveis
Buscamos um profissional experiente em desenvolvimento de pipelines escaláveis, responsável por projetar, desenvolver e manter soluções de dados que atendam às necessidades da empresa.
Na qualidade de Engenheiro de Dados, você será responsável por garantir a qualidade, consistência e disponibilidade dos dados para análises e produtos de dados. Atuará com autonomia em projetos críticos, contribuindo na padronização de processos e implementação de arquiteturas modernas.
Trabalhará em conjunto com analistas, cientistas de dados e engenheiros de software para garantir que os dados estejam prontos, acessíveis e confiáveis para uso estratégico.
Responsabilidades:
* Projetar e manter pipelines de dados em tempo real e batch, utilizando ferramentas modernas de ETL/ELT;
* Automatizar ingestão, transformação e integração de dados de diferentes fontes (APIs, bancos, eventos, arquivos);
* Trabalhar com arquitetura de dados escalável, utilizando serviços em nuvem como AWS Glue, S3, EMR, Redshift, BigQuery, etc.;
* Garantir segurança, versionamento, rastreabilidade e governança dos dados com ferramentas como Apache Airflow, dbt, Great Expectations, DataHub, etc.;
* Colaborar com áreas de negócio e times de analytics para garantir a qualidade e consistência das entregas;
* Aplacar boas práticas de modelagem de dados (Data Vault, Star Schema, Lakehouse).
Habilidades Requeridas:
* Experiência como engenheiro(a) de dados, com atuação técnica profunda;
* Experiência com Spark, Python, SQL avançado e ferramentas de orquestração (Airflow, Prefect, etc.);
* Vivência com bancos relacionais e NoSQL (PostgreSQL, MongoDB, Redis, etc.);
* Conhecimento em ferramentas de DataOps, observabilidade e CI/CD de dados;
* Experiência com ambientes cloud (AWS, Azure, GCP).
Diferenciais:
* Certificações em cloud/data engineering (ex: AWS Data Engineer, GCP Data Engineer);
* Conhecimento de arquitetura orientada a eventos (Kafka, Kinesis);
* Experiência com plataformas de catálogo e lineage de dados;
* Participação em comunidades de dados ou contribuições open source.