Observações
* Todas as nossas vagas são abertas para públicos minorizados (pessoas pretas, trans, com deficiência, LGBTQIAPN+ e outros).
* Toda a nossa comunicação é feita por e-mail e WhatsApp, atente-se à atualização dessas informações no seu currículo
O Observatório Nacional da Indústria reúne dados de inteligência com alto valor agregado, com objetivo de subsidiar as decisões estratégicas das indústrias brasileiras e aumentar a competitividade do país.
A partir de metodologias reconhecidas e estudos avançados nas temáticas de trabalho, educação, saúde, tecnologia e inovação, coletamos e analisamos dados e informações para construir cenários de futuro e produzir conhecimento aplicado.
O Observatório divulga produtos de inteligência prospectiva, estratégica e competitiva, junto ao SESI, SENAI e IEL, bem como instituições de pesquisas nacionais e estrangeiras.
Para saber mais, acesse o site:
Responsabilidades e atribuições
* Responsável por construir, evoluir e sustentar pipelines de dados em arquiteturas modernas (Data Lake e Lakehouse), garantindo que os dados estejam disponíveis, padronizados, confiáveis e otimizada para consumo analítico e operacional;
* Atuar desde a ingestão de dados (batch, APIs, webscraping) até o tratamento, modelagem e disponibilização em camadas estruturadas (bronze, silver, gold), seguindo padrões técnicos, boas práticas de engenharia, governança e qualidade de dados;
* Responsável por monitorar, diagnosticar e corrigir falhas em processos de dados, implementar melhorias contínuas, apoiar iniciativas analíticas e contribuir para a definição e aplicação de padrões arquiteturais.
Requisitos e qualificações
Formação Acadêmica
* Graduação completa em Ciência da Computação, Desenvolvimento de Sistemas, Engenharias ou áreas correlatas.
Experiência Profissional
* Atuação como Engenheiro(a) de Dados ou função equivalente, preferencialmente em ambientes de nuvem.
* Desenvolvimento e manutenção de pipelines de ingestão e processamento de dados (batch e integrações via APIs).
* Normalização, padronização e transformação de dados em arquiteturas de Data Lake / Lakehouse.
* Modelagem de dados (relacional e dimensional) e experiência com diferentes arquiteturas de armazenamento (bancos relacionais/não relacionais, DW, Data Lake).
* Atuação orientada ao negócio, colaborando com times analíticos e garantindo documentação adequada dos fluxos de dados.
Conhecimentos Específicos
* Python aplicado a engenharia de dados (requisições HTTP, manipulação e automação);
* Spark / PySpark para processamento distribuído;
* Linguagem SQL;
* Git e boas práticas de versionamento;
* Conceitos de Data Lake / Lakehouse (camadas bronze, silver, gold);
* Integração com APIs REST (GET, paginação, autenticação);
* Orquestração de pipelines (ADF ou ferramentas equivalentes);
* Noções de qualidade de dados, diagnóstico de desempenho e otimização de pipelines.
(Desejáveis) Formações, Conhecimentos e/ou Experiências
* Pós-graduação ou Mestrado em áreas correlatas;
* Certificações em engenharia de dados, Azure ou Databricks;
* Experiência com consumo de dados públicos nacionais (ex.: IBGE, CAGED, RAIS, INPI, CNES, etc.);
* Vivência na construção de webscrapers e automações.
Informações adicionais
* Informações de contratação:
* Contrato de trabalho por tempo indeterminado - CLT.
* Trabalho presencial no escritório da CNI, em Brasília/DF.
* Horário das 9h às 18h, 40h semanais, com banco de horas.
Nossos principais benefícios
* Auxílio creche
* Auxílio filho com deficiência
* Plano de Saúde (Abrangência Nacional)
* Plano Previdência Privada
* Plano Odontológico
* Seguro de Vida
* Vale-Alimentação e/ou Refeição
* Vale-Transporte
Referrals increase your chances of interviewing at CNI - Confederação Nacional da Indústria by 2x
#J-18808-Ljbffr