Requer-se profissional para desenvolver pipelines de dados e modelos em ambiente cloud, garantindo alta confiabilidade, rastreabilidade e performance.
O ideal é que você tenha experiência sólida com engenharia de software aplicada a dados e machine learning.
Proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares são necessárias.
Também é desejável ter conhecimento em MLOps e CI/CD para pipelines de dados e modelos.
Responsabilidades:
* Projetar e implementar pipelines de validação de dados e avaliação de modelos em AWS;
* Integrar dados e métricas de avaliação em um fluxo automatizado e auditável;
* Modularizar o pipeline para facilitar reuso, testes e manutenção;
* Colaborar com times de Data Science, Engenharia de Dados e Produto;
* Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados;
* Propor melhorias contínuas na arquitetura de dados e nos processos de validação.