Descrição da posição:
Buscamos profissionais sólidos em engenharia de dados, com domínio técnico em ferramentas modernas de processamento, automação e cloud. Eles atuarão em projetos estratégicos, com foco em performance, qualidade e entrega de valor para o negócio.
O que esperamos que você realize:
* Desenvolver e manter pipelines de dados utilizando PySpark;
* Integrar e processar dados em ambientes AWS, incluindo EMR, Glue, S3 e Athena;
* Automatizar fluxos de trabalho com Airflow (MWAA);
* APLICAR BOAS PRÁTICAS DE ENGENHARIA DE DADOS COM FOCO EM PERFORMANCE E ESCALABILIDADE;
* Participar da definição e implementação de processos de CI/CD;
* Realizar consultas e análises em bancos de dados utilizando SQL;
* Colaborar com times multidisciplinares para garantir entregas alinhadas com os objetivos do negócio;
* Atuar com senso de dono, buscando melhorias contínuas e soluções eficientes.
Requisitos e qualificações
O que precisamos que você tenha de conhecimento:
Obrigatórios:
* Sólido conhecimento em PySpark;
* Experiência com SQL (consultas e entendimento de modelo de dados);
* Conhecimento em AWS: EMR, Airflow (MWAA), S3, Glue, Athena;
* Familiaridade com conceitos de CI/CD;
Desejáveis:
* Experiência com Python;
* Vivência em ambientes de dados complexos e escaláveis;