Descrição
Estamos em busca de um Cientista de Dados Sênior para liderar iniciativas de modelagem preditiva e criação de modelos de machine learning em projetos de alta complexidade para nossos clientes. O profissional atuará no desenvolvimento de soluções end-to-end — da compreensão do problema de negócio à colocação de modelos em produção — em um ambiente dinâmico e desafiador. Somos movidos pela convicção de que a ciência de dados, quando bem aplicada, transforma decisões e cria valor real. Valorizamos rigor técnico, experimentação com propósito e a capacidade de contar histórias com dados. Aqui você vai trabalhar com problemas complexos, ao lado de um time multidisciplinar, com liberdade para propor abordagens inovadoras e impacto direto nos resultados dos nossos clientes.
Responsabilidades e atribuições
Desenvolver modelos de machine learning e deep learning para problemas de classificação, regressão, clustering, forecasting e otimização.
Conduzir todo o ciclo de vida de modelos: entendimento do problema, coleta e tratamento de dados, feature engineering, treinamento, validação, deploy e monitoramento.
Aplicar técnicas de LLMs e IA Generativa para automação de processos, geração de insights e desenvolvimento de soluções inteligentes.
Implementar e gerenciar pipelines de ML em ambientes de cloud (AWS ou Azure), garantindo escalabilidade e performance.
Trabalhar em conjunto com times de negócio para traduzir problemas complexos em soluções de dados acionáveis.
Apresentar resultados e recomendações para stakeholders técnicos e não técnicos, incluindo C-level.
Garantir a qualidade dos modelos por meio de testes A/B, experimentos controlados e métricas de avaliação robustas.
Contribuir para a evolução das melhores práticas de MLOps, documentação e governança de modelos.
Mentorar cientistas de dados juniores e plenos, fomentando o crescimento técnico do time.
Requisitos e qualificações
Graduação em Ciência da Computação, Estatística, Matemática, Engenharia ou áreas afins.
Mínimo de 5 anos de experiência em ciência de dados com modelos em produção.
Domínio avançado de Python (Pandas, NumPy, Scikit-learn, PyTorch ou TensorFlow).
Experiência sólida com algoritmos de ML supervisionado e não supervisionado (XGBoost, LightGBM, redes neurais, ensemble methods, etc.).
Proficiência em SQL para extração e manipulação de dados em larga escala.
Experiência com ao menos uma plataforma de cloud: AWS (SageMaker, S3, Lambda), GCP (Vertex AI, BigQuery) ou Azure (Data Bricks, ML Studio).
Conhecimento em práticas de MLOps: versionamento de modelos, CI/CD para ML, monitoramento de driftExperiência com LLMs: fine-tuning, RAG (Retrieval-Augmented Generation), engenharia de prompts ou integração via APIs (OpenAI, Anthropic, etc.)
#J-18808-Ljbffr