Desenvolver pipelines de dados e modelos com alta confiabilidade e rastreabilidade.
Buscamos um profissional com experiência em engenharia de software aplicada a dados e machine learning. Deve ter conhecimento em Python, PySpark, Pandas, Scikit-learn e ferramentas AWS como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS.
Responsabilidades:
* Projetar e implementar pipelines de validação de dados e avaliação de modelos em AWS;
* Integrar dados e métricas de avaliação em um fluxo automatizado e auditável;
* Modularizar o pipeline para facilitar reuso, testes e manutenção;
* Colaborar com times de Data Science, Engenharia de Dados e Produto;
* Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Benefícios:
* Local de atuação: remoto;
* Modelo de contratação: CLT.