Buscamos um profissional de excelência para trabalhar em projetos de Machine Learning com foco em confiabilidade e rastreabilidade.
O candidato ideal é alguém que tenha experiência sólida em engenharia de software aplicada a dados e machine learning, além de ser capaz de escrever código limpo, modular e testável.
Ainda, o profissional deve ter habilidades em Python, frameworks como PySpark, Pandas, Scikit-learn ou similares, além de experiencia com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS.
Aprender rapidamente e se adaptar às novas tecnologias também são habilidades desejáveis.
Principais responsabilidades:
Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS).
Integrar dados e métricas de avaliação em um fluxo automatizado e auditável.
Modularizar o pipeline para facilitar reuso, testes e manutenção.
Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto.
Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Propor melhorias contínuas na arquitetura de dados e nos processos de validação.
Modelo de atuação: Remoto.