Requisitos:
Devido à complexidade crescente dos dados, procuramos por um Engenheiro de Aprendizado de Máquina com experiência sólida em engenharia de software aplicada a dados e aprendizado de máquina.
Procuramos por profissionais que sejam bem versados em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares para trabalhar com grandes conjuntos de dados.
O candidato deve ter experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS, além de conhecimento em MLOps e CI/CD para pipelines de dados e modelos.
Ao contrário de outros requisitos genéricos, o nosso foco está na capacidade de orquestrar workflows e análise de métricas de avaliação de modelos (ex: MAE, RMSE, Precision, Recall).
Também valorizamos a capacidade de escrever código limpo, modular e testável. O ideal seria alguém que tenha experiência com validação de modelos de séries temporais, infraestrutura como código (Terraform, CloudFormation) e participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade.
As responsabilidades principais incluem projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS), integrar dados e métricas de avaliação em um fluxo automatizado e auditável, modularizar o pipeline para facilitar reuso, testes e manutenção, entre outras.
A única recomendação é que a escolha esteja focada no profissional com atuação remota.