Anunciada dia 16 novembro
Descrição
Descrição da Posição
O que esperamos:
* Desenvolver pipelines de dados usando PySpark
* Integrar e processar dados em ambientes AWS, incluindo EMR, Glue, S3 e Athena
* Automatizar fluxos de trabalho com Airflow (MWAA)
* Abrir boas práticas em engenharia de dados, focando em performance e escalabilidade
* Participar da definição e implementação de processos de CI/CD
* Realizar consultas e análises em bancos de dados com SQL
Requisitos e Qualificações
* Sólido conhecimento em PySpark
* Experiência com SQL (consultas e entendimento do modelo de dados)
* Conhecimento em AWS: EMR, Airflow (MWAA), S3, Glue, Athena
* Familiaridade com conceitos de CI/CD