Engenheiro de Dados
Empregador: ARCA Mobility as a Service
Contato: vaga-332308@vagas.abler.in
Tipo de Contrato: CLT
Jornada de Trabalho: De segunda à sexta, das 09h às 18h
Nível: Especialista (Mid‑Senior)
Responsabilidades
Projetar, implementar e manter pipelines de ETL/ELT para ingestão, transformação e disponibilização de dados de diversas fontes (APIs, bancos de dados, arquivos históricos, etc.).
Construir e manter o data lake e/ou data warehouse, organizando os dados de forma eficiente e acessível para os cientistas de dados e desenvolvedores.
Preparar datasets de treinamento e validação para os modelos preditivos, com foco na qualidade, consistência e rastreabilidade dos dados.
Participar ativamente da implantação e manutenção de uma feature store, viabilizando o reuso e versionamento de features para machine learning.
Colaborar com cientistas de dados e engenheiros de machine learning para operacionalizar modelos em produção com dados atualizados em tempo real.
Garantir boas práticas de governança de dados, incluindo limpeza, anonimização, versionamento e atualizações incrementais.
Automatizar processos de ingestão e transformação com ferramentas modernas como Apache Airflow, Apache Spark ou equivalentes.
Trabalhar com armazenamento em nuvem (AWS S3, Google Cloud Storage, BigQuery, Redshift) para garantir escalabilidade e performance dos fluxos de dados.
Requisitos Obrigatórios
Sólida experiência com ETL/ELT, usando ferramentas como Apache Airflow, Spark, dbt ou similares.
Domínio em modelagem de dados, tanto relacional (SQL) quanto orientada a dados analíticos.
Experiência com armazenamento em nuvem e arquitetura de dados em ambientes como AWS (S3, Glue, Redshift), GCP (BigQuery, Cloud Storage) ou Azure.
Experiência em limpeza, normalização e versionamento de dados, além de estratégias de atualização incremental.
Experiência com pipelines de dados para projetos de machine learning, como preparação de features, join de múltiplas fontes e atualização de dados em produção.
Prática com ferramentas de orquestração, agendamento e monitoramento de processos.
Experiência prévia com feature stores e sistemas de MLOps.
Conhecimento em programação com Python ou Scala, voltada a manipulação de dados.
Graduação completa em Engenharia (Computação, Mecânica, Dados, Ciência de Dados, Sistemas de Informação) e áreas afins.
Sobre a Empresa
Somos uma empresa de tecnologia especializada em desenvolver soluções para o segmento transporte Rodoviário e Mobilidade.
Nosso propósito é conectar origens a destinos no mundo, ajudando na decisão de mobilidade das pessoas.
#J-18808-Ljbffr