O objetivo principal é projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud.
Os principais responsáveis devem integrar dados e métricas de avaliação em um fluxo automatizado e auditável, além de modularizar o pipeline para facilitar reuso, testes e manutenção.
A parceria entre times de Data Science, Engenharia de Dados e Produto é fundamental para garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Fica a cargo do profissional propor melhorias contínuas na arquitetura de dados e nos processos de validação.
Modelo de atuação remoto
Requisitos:
* Experiência sólida com engenharia de software aplicada a dados e machine learning;
* Proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares;
* Experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS;
* Conhecimento em MLOps e CI/CD para pipelines de dados e modelos;
* Experiência com orquestração de workflows;
* Familiaridade com métricas de avaliação de modelos (ex: MAE, RMSE, Precision, Recall);
* Capacidade de escrever código limpo, modular e testável.
Desejáveis:
* Experiência com validação de modelos de séries temporais;
* Experiência com infraestrutura como código (Terraform, CloudFormation);
* Participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade.
Prazos:
Não há informação disponível sobre prazos.