Nossa missão em Fraud Prevention é garantir que cada transação no Mercado Livre seja segura, escalável e ofereça a melhor experiência possível aos nossos milhões de usuários. Para isso, combinamos grandes volumes de dados tabulares (estruturados) e não estruturados dos serviços financeiros (Mercado Pago) e marketplace (Mercado Livre), comportamento e rede com técnicas de Machine Learning e Deep Learning.DesafioBuscamos uma pessoa com sólida formação teórica e domínio prático de todo o ciclo de vida de modelos supervisionados de grande escala, desde a curadoria dos dados de treinamento até o monitoramento em produção.Responsabilidades principais - Liderar o desenho, o treinamento e a validação de modelos de machine/deep learning (principalmente com dados tabulares).- Garantir a qualidade do conjunto de treinamento (data quality, balanceamento, etiquetagem, deduplicação, drift, dados faltantes) e propor métricas apropriadas de erro e perda.- Implementar treinamento (inclusive distribuído) para grandes bases usando Tensor Flow / Py Torch + frameworks de gradient boosting (Light GBM / XGBoost) com otimização de hiperparâmetros.- Atuar como referência técnica em Teoria de Machine Learning, com capacidade de analisar bias-variance trade-off, complexidade de modelos (VC-dimension) e estratégias de regularização que minimizem o risco empírico e maximizem a capacidade de generalização.- Conduzir experimentos A/B e análises offline/online, definindo protocolos robustos de avaliação e intervalos de confiança.- Acompanhar modelos em produção: monitoramento de performance, detecção de drift, re-treino automático e governança.- Mentorar cientistas e engenheiros de ML, divulgando boas práticas de versionamento de dados/modelos, testes unitários e MLOps.Requisitos obrigatórios ✓ Graduação completa ou mestrado/doutorado na área de Computação, Matemática, Estatística ou Engenharia com tese na área de Machine Learning✓ Fundamentos de Aprendizado de Máquina: Bias-variance dilemma, under/overfitting, regularização (L1/L2, dropout, early-stopping); Teoria de complexidade e generalização (VC-dimension) e minimização de risco empírico; Otimização por gradiente e backpropagation; derivação de loss functions e análise de convexidade.✓ Experiência com dados tabulares de grande volume (ordem de milhões de dados): feature engineering, feature stores, encoding de features (feature embeddings), data leakage awareness.✓ Domínio de modelos supervisionados clássicos e ensembles (em particular Gradient Boosting Decision Trees) e de redes neurais profundas: (i) arquiteturas: recorrentes, selective state spaces, mecanismos de atenção, (ii) arquiteturas encoder/decoder e multi-branch, (iii) estratégias e técnicas de treinamento: camadas de embedding, normalização, KV cache, positional encoding, (iv) funções de perda para tarefas de classificação, reconstrução, contrastive learning, masking e next-token prediction.✓ Sólida prática em Python e ciclo de desenvolvimento de software de Machine Learning, em pelo menos um dos frameworks: Tensor Flow ou Py Torch; além de bibliotecas básicas (Pandas, Num Py, scikit-learn, Light GBM, XGBoost).✓ Experiência em liderança técnica ou gestão de projetos de machine learning ponta-a-ponta.✓ Inglês técnico para leitura e redação de documentação científica.Diferenciais que nos encantam• Publicações científicas ou participação ativa em comunidades de Deep/Machine Learning.• Noções de processamento distribuído, ex. usando Ray.• Vivência em sistemas de detecção de fraude, prevenção a lavagem de dinheiro ou risco de crédito.Formato de trabalho Modelo híbrido: 80 % remoto, 20 % presencial (~4 dias/mês). Escritório principal em Osasco/SP (Melicidade); possibilidade de base em Florianópolis/SC com visitas periódicas a SP.Como se candidatarEnvie CV e/ou Linked In atualizado e breve descrição de um projeto relevante envolvendo grandes volumes de dados com deep learning.Venha construir, aprender e escalar soluções que protegem a maior plataforma de e-commerce e serviços financeiros da América Latina!