Job description
Observações:
Todas as nossas vagas são abertas para públicos minorizados (pessoas pretas, trans, com deficiência, LGBTQIAPN+ e outros).
Toda a nossa comunicação é feita por e-mail e WhatsApp, atente-se à atualização dessas informações no seu currículo!
O Observatório Nacional da Indústria reúne dados de inteligência com alto valor agregado, com objetivo de subsidiar as decisões estratégicas das indústrias brasileiras e aumentar a competitividade do país.
A partir de metodologias reconhecidas e estudos avançados nas temáticas de trabalho, educação, saúde, tecnologia e inovação, coletamos e analisamos dados e informações para construir cenários de futuro e produzir conhecimento aplicado.
O Observatório divulga produtos de inteligência prospectiva, estratégica e competitiva, junto ao SESI, SENAI e IEL, bem como instituições de pesquisas nacionais e estrangeiras.
Para saber mais, acesse o site: https://www.portaldaindustria.com.br/canais/observatorio-nacional-da-industria/
Main responsibilities
Responsável por construir, evoluir e sustentar pipelines de dados em arquiteturas modernas (Data Lake e Lakehouse), garantindo que os dados estejam disponíveis, padronizados, confiáveis e otimizados para consumo analítico e operacional;
Atuar desde a ingestão de dados (batch, APIs, webscraping) até o tratamento, modelagem e disponibilização em camadas estruturadas (bronze, silver, gold), seguindo padrões técnicos, boas práticas de engenharia, governança e qualidade de dados;
Responsável por monitorar, diagnosticar e corrigir falhas em processos de dados, implementar melhorias contínuas, apoiar iniciativas analíticas e contribuir para a definição e aplicação de padrões arquiteturais.
Requirements and skills
Formação Acadêmica
Graduação completa em Ciência da Computação, Desenvolvimento de Sistemas, Engenharias ou áreas correlatas.
Experiência Profissional
Atuação como Engenheiro(a) de Dados ou função equivalente, preferencialmente em ambientes de nuvem.
Desenvolvimento e manutenção de pipelines de ingestão e processamento de dados (batch e integrações via APIs).
Normalização, padronização e transformação de dados em arquiteturas de Data Lake / Lakehouse.
Modelagem de dados (relacional e dimensional) e experiência com diferentes arquiteturas de armazenamento (bancos relacionais/não relacionais, DW, Data Lake).
Atuação orientada ao negócio, colaborando com times analíticos e garantindo documentação adequada dos fluxos de dados.
Conhecimentos Específicos
Python aplicado a engenharia de dados (requisições HTTP, manipulação e automação);
Spark / PySpark para processamento distribuído;
Linguagem SQL;
Git e boas práticas de versionamento;
Conceitos de Data Lake / Lakehouse (camadas bronze, silver, gold);
Integração com APIs REST (GET, paginação, autenticação);
Orquestração de pipelines (ADF ou ferramentas equivalentes);
Noções de qualidade de dados, diagnóstico de desempenho e otimização de pipelines.
(Desejáveis) Formações, Conhecimentos e/ou Experiências
Pós-graduação ou Mestrado em áreas correlatas;
Certificações em engenharia de dados, Azure ou Databricks;
Experiência com consumo de dados públicos nacionais (ex.: IBGE, CAGED, RAIS, INPI, CNES, etc.);
Vivência na construção de webscrapers e automações.
Additional information
Informações de contratação:
Contrato de trabalho por tempo indeterminado - CLT.
Trabalho presencial no escritório da CNI, em Brasília/DF.
Horário das 9h às 18h, 40h semanais, com banco de horas.
Nossos principais benefícios:
Auxílio creche
Auxílio filho com deficiência
Plano de Saúde (Abrangência Nacional)
Plano de Previdência Privada
Plano Odontológico
Seguro de Vida
Vale-Alimentação e/ou Refeição
Vale-Transporte
#J-18808-Ljbffr