A plataforma de dados é a vida sanguínea da empresa moderna.
Buscamos uma pessoa engenheira de dados sênior para atuar na construção e evolução dessa plataforma, solução interna que acelera o desenvolvimento de modelos de machine learning e inteligência artificial.
O foco será no desenvolvimento de pipelines performáticos, frameworks reutilizáveis e mecanismos de qualidade de dados, com forte colaboração com os times de Data Science e MLOps:
* Desenvolver pipelines escaláveis e de alta performance;
* Projetar soluções com foco em modularização, versionamento e reuso;
* Criar e manter frameworks internos para automação de processos;
* Implementar mecanismos de validação e monitoramento de dados;
Requisitos e qualificações
- Experiência sólida com Spark (PySpark) e processamento distribuído;
- Domínio de AWS (S3, EMR, Glue, Lambda, Step Functions, Redshift);
- Prática com Terraform e conceitos de infraestrutura como código;
- Conhecimento em CI/CD com uso de Git e Jenkins;
- Vivência com frameworks de Data Quality ou validações customizadas;
Diferenciais
- Experiência com automação de pipelines de dados e projetos de MLOps/Feature Store.
Nossa empresa oferece uma oportunidade única de trabalhar em uma equipe dinâmica e inovadora, com acesso a tecnologias avançadas e um ambiente de trabalho flexível. Se você busca desafios interessantes e oportunidades de crescimento, aqui é o lugar certo para você!