Escalabilidade e Confiabilidade em Modelos de Dados
\
A empresa busca profissionais experientes em engenharia de software aplicada a dados e machine learning, com habilidades sólidas em Python e frameworks como PySpark, Pandas e Scikit-learn.
O candidato ideal deve ter experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker e ECS, além de conhecimento em MLOps e CI/CD para pipelines de dados e modelos.
Ao longo do processo, o colaborador trabalhará em colaboração com times de Data Science, Engenharia de Dados e Produto, garantindo boas práticas de versionamento, logging, monitoramento e testes automatizados.
Responsabilidades:
\
\
1. Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS);
\
2. Integrar dados e métricas de avaliação em um fluxo automatizado e auditável;
\
3. Modularizar o pipeline para facilitar reuso, testes e manutenção;
\
4. Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto;
\
5. Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados;
\
6. Propor melhorias contínuas na arquitetura de dados e nos processos de validação;
\
7. Modelo de atuação: Remoto.
\