Carreira de Dados
A Empresa busca um profissional para compor o time responsável por estruturar a fundação de dados que alimenta nossa solução de precificação dinâmica e predição de ocupação com base em inteligência artificial.
Nossa proposta é garantir escalabilidade e performance nos fluxos de dados através de armazenamento em nuvem, como AWS S3, Google Cloud Storage, BigQuery, Redshift.
* Projetar, implementar e manter pipelines de ETL/ELT para ingestão, transformação e disponibilização de dados de diversas fontes (APIs, bancos de dados, arquivos históricos, etc.).
* Construir e manter o data lake e/ou data warehouse, organizando os dados de forma eficiente e acessível para os cientistas de dados e desenvolvedores.
* Preparar datasets de treinamento e validação para os modelos preditivos, com foco na qualidade, consistência e rastreabilidade dos dados.
* Participar ativamente da implantação e manutenção de uma feature store, viabilizando o reuso e versionamento de features para machine learning.
* Colaborar com cientistas de dados e engenheiros de machine learning para operacionalizar modelos em produção com dados atualizados em tempo real.
* Garantir boas práticas de governança de dados, incluindo limpeza, anonimização, versionamento e atualizações incrementais.
* Automatizar processos de ingestão e transformação com ferramentas modernas como Apache Airflow, Apache Spark ou equivalentes.
O nosso produto visa transformar a maneira como viações gerenciam seus preços e rotas, utilizando modelos estatísticos e de machine learning aplicados sobre grandes volumes de dados históricos e contextuais.
Somos uma empresa especializada em desenvolver soluções para o segmento transporte Rodoviário e Mobilidade. Nós trabalhamos com tecnologia para conectar origens a destinos no mundo, ajudando na decisão de mobilidade das pessoas.