Se você é analítico(a), curioso(a) e gosta de transformar dados em decisões estratégicas, essa vaga pode ser para você!Buscamos um(a) Cientista de Dados para atuar na área de Engenharia de Dados, desenvolvendo soluções preditivas e aplicações com IA generativa. Sua missão será identificar oportunidades de negócio a partir da modelagem estatística, machine learning e análise de grandes volumes de dados. Conhecimentos técnicos Python: pandas, scikit-learn, XGBoost Banco de dados: SQL e NoSQL Estatística aplicada: distribuições, testes de hipóteses, regressões Inglês: leitura técnica para consultas e referências online Responsabilidades principais Ingestão e tratamento de dados: escrever consultas SQL e scripts de extração em bancos relacionais e não-relacionais; padronizar, normalizar e enriquecer datasets. Pipeline de dados em Python: implementar fluxos de ETL com pandas e outras bibliotecas para tratar os dados a serem utilizados. Modelagem preditiva: desenvolver, treinar e validar modelos de classificação e regressão (scikit-learn, XGBoost), identificando perfis e oportunidades de upsell/cross-sell. Data augmentation: projetar e aplicar técnicas de ampliação de dados (SMOTE, bootstrapping, sintetização) para melhorar a robustez em cenários com poucos exemplos. Monitoramento e manutenção: acompanhar métricas de performance (ROC-AUC, F1-Score, Precision/Recall), automatizar alertas de deriva de dados e retrainings quando necessário. Colaboração multidisciplinar: trabalhar junto aos times de Produto e Marketing para definir hipóteses, planejar testes A/B e traduzir resultados em insights acionáveis. IA generativa: prototipar soluções com LLMs (ChatGPT, GPT-4, etc.) ou ferramentas open-source para automação de relatórios, chatbots internos e enriquecimento de dados textuais.