Transforme a forma como você trabalha com dados.
Na nossa empresa, acreditamos na tecnologia como uma força para transformar realidades e gerar impacto positivo. Desenvolvemos soluções que conectam inovação, eficiência e progresso em setores essenciais.
Aqui, você encontra um ambiente que valoriza a autonomia, a colaboração e o crescimento contínuo, com projetos desafiadores e oportunidades reais de desenvolvimento.
Nossos princípios fundamentais são:
* **Inovar com propósito**
* **Crescer com responsabilidade**
* **Valorizar a diversidade e quem transforma**
Alguns dos nossos valores incluem:
* **Inovação**
* **Conexão**
* **Confiança**
* **Antecipação de futuro**
Se você busca desafios com significado, é aqui que você pode encontrar seu lugar.
Responsabilidades
Desenvolver e manter pipelines de dados em lote usando o PySpark (focado em SQL)
Escrever e otimizar consultas SQL complexas para dar suporte à lógica de negócios e às necessidades de relatórios
Entender os requisitos de forma autônoma e traduzir para código
Transformar e integrar dados de diversas fontes em tabelas Iceberg e Snowflake
Contribuir para o desenvolvimento de data marts e conjuntos de dados selecionados para consumo comercial
Colaborar com analistas de negócios para entender as necessidades de dados
Monitore e gerencie trabalhos de dados em execução no AWS EMR orquestrados pelo Airflow, aproveitando o S3, o Glue e outros serviços da AWS
Garantir a qualidade, a consistência e o desempenho dos dados em todo o pipeline
Requisitos Técnicos e de Experiência
Analista de Dados PL qualificado com uma base sólida em desenvolvimento baseado em SQL.
Essa função se concentrará na criação e manutenção de pipelines de dados usando o PySpark, com SQL como a linguagem de codificação principal.
O candidato também terá uma boa compreensão das estruturas de modelagem de dados (como modelagem dimensional Kimball) e experiência no suporte a datawarehouses e data marts.
Qualificações Preferenciais
Experiência na criação e gerenciamento de data marts
Exposição ao Airflow ou outras ferramentas de orquestração
Familiaridade com ferramentas de infraestrutura como código, como o Terraform
Compreensão dos padrões ODS (Operacional Data Store) e arquitetura de data lake
Experiência com Bitbucket (ou qualquer ferramenta git semelhante)
Experiência/compreensão de Jenkins
Habilidades Comportamentais e Competências
Fluência em inglês é um diferencial
Experiência comprovada em SQL – incluindo junções, agregações, funções de janela e ajuste de desempenho
Experiência prática com o PySpark, particularmente com o Spark SQL
Familiaridade com os serviços de dados da AWS (por exemplo, EMR, S3, Glue)
Compreensão de estruturas de modelagem de dados, incluindo a metodologia Kimball
Experiência de trabalho com Snowflake ou data warehouses em nuvem semelhantes
Conhecimento do Apache Iceberg ou formatos de tabela semelhantes (por exemplo, Delta Lake, Hudi)
Nível de Experiência Desejado
Pleno
Modelo de Contratação
CLT
Plano de Saúde subsidiado pela empresa para o titular.
Opção de inclusão de dependentes no Plano de Saúde com desconto em folha de pagamento.
Assistência Odontológica (opcional).
Opção de inclusão de dependentes no Plano de Assistência Odontológica com desconto em folha de pagamento.
Vale Refeição no cartão Flash Benefícios.
Vale Transporte (opcional).
POP - Programa de Orientação Pessoal que visa oferecer suporte emocional e aconselhamento com orientação confidencial nas áreas psicológica, jurídica, financeira, social e pet sem custo para titular e dependentes legais.
Plataforma de Saúde Wellhub-Gympass (Acesso a mais de 700 academias em todo o Brasil com planos descontado em folha de pagamento).
Parcerias com grandes marcas de consumo.
Convênio com o SESC para titular e dependentes.
Convênios para descontos com instituições de ensino (graduação e pós-graduação) e escola de idiomas.
Seguro de vida em grupo.