Description
A equipe de Produção de Dados suporta as arquiteturas de dados que correspondam às necessidades das pesquisas realizadas no CIDACS, mapeando os requisitos e construindo fluxos adequados, visando garantir a eficiência, desempenho e qualidade no tratamento dos dados. Os membros da equipe são responsáveis pelas atividades de manipulação, transformação, vinculação de bases de dados, acurácia e extração de datasets para pesquisa.
Os currículos submetidos a esse perfil farão parte do nosso Banco de Talentos | Engenheiro de Dados Júnior [2025:2026], que significa seu processo terá sequência assim que houver abertura efetiva dessa vaga. Se você se enquadra no perfil, não deixe de se candidatar
Responsibilities
* Colaborar no desenvolvimento de pipeline de dados em linguagem adequada;
* Colaborar na elaboração e desenvolvimento de soluções relacionadas à produção de dados (ETL) e à vinculação determinística e não-determinística entre bases de dados;
* Auxiliar as atividades de manipulação, transformação, vinculação entre bases de dados, análise de acurácia e extração de datasets para pesquisa;
* Documentar processos do pipeline de tratamento e transformação dos dados de forma clara e detalhada;
* Participar de reuniões e sessões técnicos-científicas;
* Elaborar e apresentar relatórios técnicos periódicos.
Prerequisites
* Graduação plena ou tecnológica em Ciência da Computação, Engenharia da Computação, Engenharia de Software, Estatística ou áreas correlatas;
* Conhecimento nas linguagens de programação Python;
* Conhecimento em Python e bibliotecas de manipulação/análise de dados (ex.: Pandas, PySpark);
* Noções de Linux e Bash;
* Noções de sistemas de controle de versão (Git);
* Boa comunicação e capacidade de trabalho em equipe multidisciplinar;
* Inglês técnico para leitura de documentação.
Experiences
* Experiência no manejo de grandes volumes de dados;
* Conhecimento em Apache Spark;
* Conhecimento em análise estatística de dados;
* Conhecimento em estruturas de dados (filas, pilhas, listas, grafos etc.);
* Noções de Paralelismo e Distribuição;
* Noções de linguagem SQL;
* Vivência com projetos na área de Engenharia de Dados;
* Inglês intermediário (leitura, escrita e conversação).
*Esses são requisitos diferenciais, portanto não é preciso tê-los para se candidatar, mas é importante ter disposição para desenvolver essas habilidades.