Somos uma oportunidade para especialistas em machine learning que buscam trabalhar em projetos de varejo.
Na nossa equipe, você desenvolverá pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS).
Você terá a responsabilidade de projetar e implementar esses pipelines, garantindo que eles sejam automatizados e auditáveis.
O seu trabalho envolverá integrar dados e métricas de avaliação em um fluxo automatizado.
Também será necessário modularizar o pipeline para facilitar reuso, testes e manutenção.
Você trabalhará em colaboração com times de Data Science, Engenharia de Dados e Produto.
E o seu objetivo é garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
Você também precisará propor melhorias contínuas na arquitetura de dados e nos processos de validação.
e criar um ambiente onde os modelos de aprendizado de máquina possam ser validados e implantados rapidamente.
Além disso, você precisará ter conhecimento em orquestração de workflows e capacidade de escrever código limpo, modular e testável.
No entanto, não há experiência necessária em validação de séries temporais ou infraestrutura como código.
Ambiente de trabalho remoto e tempo de projeto indeterminado.
Requisitos:
* Experiência sólida com engenharia de software aplicada a dados e machine learning;
* Proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares;
* Conhecimento em MLOps e CI/CD para pipelines de dados e modelos;
* Familiaridade com métricas de avaliação de modelos;
* Capacidade de escrever código limpo, modular e testável;
Desejáveis:
Experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS.
Experiência com orquestração de workflows.
Participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade.
Responsabilidades principais:
Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS);
Integrar dados e métricas de avaliação em um fluxo automatizado e auditável;
Modularizar o pipeline para facilitar reuso, testes e manutenção;
Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto;
Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados;
Propor melhorias contínuas na arquitetura de dados e nos processos de validação;
Venham fazer parte do nosso time!
],