**Papel:** Análise de Dados
Descrição:
Desenvolver e manter pipelines de dados em lote usando o PySpark.
Transforme e integre dados de diversas fontes em tabelas Iceberg e Snowflake, contribuindo para o desenvolvimento de data marts e conjuntos de dados selecionados para consumo comercial.
Aqui estão algumas das responsabilidades:
* Escreva e otimize consultas SQL complexas para dar suporte à lógica de negócios e às necessidades de relatórios;
* Entenda os requisitos de forma autônoma e traduza para código;
* Monitore e gerencie trabalhos de dados em execução no AWS EMR orquestrados pelo Airflow, aproveitando o S3, o Glue e outros serviços da AWS;
* Garanta a qualidade, a consistência e o desempenho dos dados em todo o pipeline.
**Requisitos Técnicos e de Experiência:)
* Análise de Dados PL qualificado com uma base sólida em desenvolvimento baseado em SQL;
* Experiência na criação e gerenciamento de data marts;
* Exposição ao Airflow ou outras ferramentas de orquestração;
* Familiaridade com ferramentas de infraestrutura como código, como o Terraform.