O objetivo desse papel é projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud. Este profissional trabalhará colaborativamente com times de Data Science, Engenharia de Dados e Produto.
Requisitos:
* A experiência sólida na engenharia de software aplicada a dados e machine learning;
* A proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares;
* A experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS;
* O conhecimento em MLOps e CI/CD para pipelines de dados e modelos;
* A capacidade de escrever código limpo, modular e testável.
Desejáveis:
* A experiência com validação de modelos de séries temporais;
* A experiência com infraestrutura como código (Terraform, CloudFormation);
* A participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade.
Responsabilidades:
1. Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud;
2. Integrar dados e métricas de avaliação em um fluxo automatizado e auditável;
3. Modularizar o pipeline para facilitar reuso, testes e manutenção;
4. Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto;
5. Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Evidências de habilidades técnicas também são bem-vindas.