Responsabilidades e atribuições
Descrição da posição: Buscamos um(a) profissional com sólida experiência em engenharia de dados, com domínio técnico em ferramentas modernas de processamento, automação e cloud. A pessoa atuará em projetos estratégicos, com foco em performance, qualidade e entrega de valor para o negócio.
O que esperamos que você realize:
* Desenvolver e manter pipelines de dados utilizando PySpark .
* Integrar e processar dados em ambientes AWS, incluindo EMR, Glue, S3 e Athena.
* Automatizar fluxos de trabalho com Airflow (MWAA) .
* Aplicar boas práticas de engenharia de dados com foco em performance e escalabilidade.
* Participar da definição e implementação de processos de CI/CD .
* Realizar consultas e análises em bancos de dados utilizando SQL .
* Colaborar com times multidisciplinares para garantir entregas alinhadas com os objetivos do negócio.
* Atuar com senso de dono, buscando melhorias contínuas e soluções eficientes.
Requisitos e qualificações
O que precisamos que você tenha de conhecimento:
Obrigatórios:
* Sólido conhecimento em PySpark
* Experiência com SQL (consultas e entendimento de modelo de dados)
* Conhecimento em AWS : EMR, Airflow (MWAA), S3, Glue, Athena
* Familiaridade com conceitos de CI/CD
Desejáveis:
* Experiência com Python
* Vivência em ambientes de dados complexos e escaláveis