**Sobre a Vaga**
Você será responsável por construir e manter pipelines de dados no Data Lake de Gente, tratar e modelar dados para consumo de negócio, monitorar e garantir qualidade dos dados, criar e disponibilizar bases para projetos de analytics.
Principais Atividades:
* Analisar e organizar dados brutos;
* Modelagem de dados dimensional (Star e Snowflake Schema);
* Construir e manter Jobs de ETL's;
* Construir e manter pipelines de dados;
* Preparar dados para projetos de analytics;
* Explorar maneiras de melhorar a qualidade e confiabilidade dos dados;
* Desenvolver ferramentas e programas analíticos;
* Colaborar com cientistas de dados e especialistas de negócios em vários projetos.
Requisitos:**
* Python, SQL e Shell Script;
* Aprendizado Apache Spark/PySpark;
* Modelagem dimensional de dados;
* Ferramentas de ETL's;
* Desejável Ambiente Cloud AWS;
* Desejável Git Hub, Cloud9.
O que Você Pode Esperar da Nós?**
* Todos os benefícios de Mercado: Assistência Médica e Odontológica, Vale Refeição, Vale Transporte e Participação nos lucros;
* Plano Gympass para ajudar na qualidade de vida;
* Desconto em serviços de manicure, design de sobrancelhas e massagem;
* Bolsa de estudo dentro das nossas marcas.
Trabalhamos com a cultura Ágil e tecnologias de ponta. Estamos em busca de transformação em todos os sentidos: de histórias, de vidas, do futuro. Agimos pensando no sucesso do aluno.