Descrição da Vaga
O nosso time procura por profissionais de alto nível com experiência em engenharia de dados e machine learning para projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud.
É uma oportunidade para quem busca contribuir com soluções inovadoras para problemas complexos, trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto, e garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Aqui você terá a chance de modularizar o pipeline para facilitar reuso, testes e manutenção, integrar dados e métricas de avaliação em um fluxo automatizado e auditável, e propor melhorias contínuas na arquitetura de dados e nos processos de validação.
Para esse papel, procuramos alguém com proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares, além de experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS.
Além disso, é fundamental conhecer em MLOps e CI/CD para pipelines de dados e modelos, bem como ter capacidade de escrever código limpo, modular e testável.
Não é necessário ter experiência com infraestrutura como código (Terraform, CloudFormation) ou participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade, mas é sempre um plus.