O objetivo desta oportunidade é encontrar um profissional experiente para projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud. O candidato ideal terá experiência sólida com engenharia de software aplicada a dados e machine learning, bem como proficiência em Python e frameworks como PySpark, Pandas e Scikit-learn.
As responsabilidades incluem projetar pipelines de validação de dados e avaliação de modelos, integrar dados e métricas de avaliação em um fluxo automatizado e auditável, modularizar o pipeline para facilitar reuso, testes e manutenção, trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto, garantir boas práticas de versionamento, logging, monitoramento e testes automatizados, e propor melhorias contínuas na arquitetura de dados e nos processos de validação.
Os requisitos incluem:
* Experiência sólida com engenharia de software aplicada a dados e machine learning;
* Proficiência em Python e frameworks como PySpark, Pandas e Scikit-learn;
* Experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena e SageMaker;
* Conhecimento em MLOps e CI/CD para pipelines de dados e modelos;
* Experiência com orquestração de workflows;
* Familiaridade com métricas de avaliação de modelos (ex: MAE, RMSE, Precision, Recall);
* Capacidade de escrever código limpo, modular e testável.
Observações importantes incluem a necessidade de trabalho remoto, tempo de projeto indeterminado e a possibilidade de crescimento pessoal e profissional.