O nosso time de Engenharia de Dados está procurando por um profissional experiente em Machine Learning para se juntar a nós.
Descrição do cargo
Neste papel, você projetará e implementará pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS). Integrará dados e métricas de avaliação em um fluxo automatizado e auditável. Modularizará o pipeline para facilitar reuso, testes e manutenção.
Você trabalhará em colaboração com times de Data Science, Engenharia de Dados e Produto para garantir boas práticas de versionamento, logging, monitoramento e testes automatizados. Além disso, proporá melhorias contínuas na arquitetura de dados e nos processos de validação.
Responsabilidades
* Projetar e implementar pipelines de validação de dados e avaliação de modelos em ambiente cloud (AWS).
* Integrar dados e métricas de avaliação em um fluxo automatizado e auditável.
* Modularizar o pipeline para facilitar reuso, testes e manutenção.
* Trabalhar em colaboração com times de Data Science, Engenharia de Dados e Produto.
* Garantir boas práticas de versionamento, logging, monitoramento e testes automatizados.
* Propor melhorias contínuas na arquitetura de dados e nos processos de validação.
Criterios de Seleção
* Experiência sólida com engenharia de software aplicada a dados e machine learning.
* Proficiência em Python e frameworks como PySpark, Pandas, Scikit-learn ou similares.
* Experiência com ferramentas e serviços AWS, como S3, Lambda, Step Functions, Glue, Athena, SageMaker ou ECS.
* Conhecimento em MLOps e CI/CD para pipelines de dados e modelos.
* Experiência com orquestração de workflows.
* Familiaridade com métricas de avaliação de modelos (ex: MAE, RMSE, Precision, Recall).
* Capacidade de escrever código limpo, modular e testável.
Educação e Experiência
Candidato deve ter experiência em desenvolvimento de sistemas, ciência de dados, análise de dados, automação de tarefas, conteúdo digital e marketing, modelagem preditiva, algoritmos de aprendizado de máquina e big data.
Requisitos
* Desejável experiência com validação de modelos de séries temporais.
* Desejável experiência com infraestrutura como código (Terraform, CloudFormation).
* Desejável participação em projetos de ML em produção com foco em confiabilidade e rastreabilidade.