1. Conhecimento em SQL;
2. Conhecimentos com a linguagem de programação Python;
3. Experiência ou interesse em PySpark e Spark;
4. Conhecimentos sobre a plataforma Databricks;
5. Domínio dos conceitos de ETL e ELT;
6. Experiência com bancos de dados relacionais (ex: MySQL, PostgreSQL) e não relacionais (ex: MongoDB, Cassandra);
7. Experiência com ferramentas de automação de workflows de dados;
8. Formação em ciências da computação, engenharia de dados, e áreas correlatas.
* Vivenciar a identidade organizacional do Grupo Brisanet;
* Preparar relatórios, formulários ou planilhas, conforme solicitações;
* Propor melhorias para as rotinas e processos da área;
* Alimentar indicadores da área;
* Participar ativamente das reuniões e compromissos da organização, quando solicitado;
* Prestar atendimento aos colaboradores em assuntos relacionados à área;
* Utilizar os equipamentos de segurança individual e coletiva, quando necessário;
* Criar e manter pipelines de dados (ETL/ELT) para garantir que os dados sejam limpos, transformados e carregados corretamente nos sistemas apropriados para análise;
* Garantir que os dados sejam coletados de diversas fontes internas e externas, além de integrá-los em um formato adequado para análise;
* Implementar processos de validação e verificação da qualidade dos dados para garantir que os dados sejam precisos, consistentes e confiáveis;
* Otimizar a performance dos sistemas de dados, garantindo que possam lidar com grandes volumes de dados de forma escalável e eficiente;
* Criar e manter a documentação dos processos de dados desenvolvidos;
* Trabalhar de forma colaborativa com cientistas de dados, analistas de dados e equipes de TI para fornecer a infraestrutura necessária para análise e relatórios;
* Monitorar continuamente os sistemas de dados, identificando e resolvendo problemas rapidamente para garantir que o fluxo de dados não seja interrompido.