Estamos em busca de uma pessoa Machine Learning Engineer Sênior com forte experiência em Databricks e MLflow para liderar a construção de uma nova Feature Store corporativa, atuando com arquitetura, governança, qualidade e escalabilidade para projetos de Machine Learning.Modelo de Trabalho: RemotoPrincipais Responsabilidades:Desenvolvimento de Framework Core: Desenvolver componentes modulares e reutilizáveis (Writer, Data Quality, Feature Functions) baseados em boas práticas de engenharia de software, evitando os famosos /"Spaghetti Notebooks/";
Garantia de Qualidade e Auditoria: Implementar motores de validação de dados (Data Quality) integrados a ferramentas como Great Expectations ou Delta Expectations, criando lógica de /"Gatekeeper/" para bloquear dados inconsistentes;
Modelagem e PersistênciaHistórica: Desenvolver lógicas avançadas de persistência de dados históricos, incluindo SCD Tipo 2 e Tipo 4, garantindo consistência temporal completa (Point-in-Time Correctness via as-of join);
Governança e Linhagem: Estruturar o registro de metadados de negócio e técnicos no Unity Catalog (Feature Registry), garantindo consistência semântica e rastreabilidade total integrando com MLflow (FeatureLookup);
Orquestração e DevOps deDados: Configurar e orquestrar pipelines de dados complexos e atômicos no Databricks, gerenciando de forma eficiente ambientes (Dev/Prod) e políticas de versionamento/release;
Foco no Usuário (Discovery & UX): Realizar rodadas de alinhamento com Cientistas de Dados para coletar feedbacks, ajustar escopos técnicos e garantir que a usabilidade da Feature Store atenda às reais necessidades do time de negócios;
Disseminação de Conhecimento: Liderar a migração de projetos piloto, criar documentações no estilo Self-Service (/"Como criar minha primeira Feature/") e ministrar workshops práticos (Hands-on) para capacitar o time de Ciência de Dados.Requisitos:Experiência sólida e comprovada atuando como Engenheiro(a) de Dados Sênior ou Engenheiro(a) de Machine Learning;
Domínio avançado do ecossistema Databricks (incluindo Unity Catalog, Delta Tables, Databricks Workflows/Jobs);
Fortes conhecimentos em frameworks de validação de dados (ex: Great Expectations ou Delta Expectations);
Sólida experiência com MLflow para gerenciamento do ciclo de vida de modelos e linhagem de features.[;
Experiência prática com estratégias de versionamento de dados e histórico (SCD Tipo 2 / Tipo 4);
Proficiência em Python voltado para desenvolvimento de pacotes, classes reutilizáveis e testes unitários independentes;
Conhecimento em conceitos de governança de dados (Metadados, Catálogo, Linhagem, Controle de Acesso).Diferenciais:Experiência prévia na implementação de Feature Stores do zero (ex: Feast, Databricks Feature Store);
Familiaridade com taxonomias de transformações complexas (MIT, MDT, ODT);
Conhecimento da metodologia/lógica de negócio modular E-A-C-TIM.