Cientista de Dados – Modelagem Espacial
Você deve preencher o formulário disponível no link abaixo
https://striped-owner-101.notion.site/1ee1d5630e8e807d8cabdaf14e485a7e?pvs=105
Contratação
Tipo de Bolsa: Bolsa de Desenvolvimento Tecnológico DT-I — R$ 5.200,00 (Valores fixos conforme edital FAPEMIG; sem negociação)
Contratação como pessoa física, sem vínculo CLT, MEI ou PJ.
Local de Trabalho 100 % home‑office, obrigatoriamente residente em Minas Gerais.
Formação: Graduação e experiência equivalente (≥6 anos) em ciência de dados, modelagem espacial de dados ambientais ou áreas correlatas ou Doutorado na área.
IMPORTANTE
Esses requisitos são exigência da FAPEMIG, não sendo possível alterar qualquer ponto.
Descrição Geral
O Cientista de Dados será responsável pelo desenvolvimento de modelos preditivos segmentados de risco de acidentes rodoviários, utilizando dados geoespaciais, telemática veicular e infraestrutura viária. O foco será a criação de algoritmos robustos para identificar, prever e priorizar áreas de alto risco nas estradas brasileiras, bem como atuar em ambiente multidisciplinar colaborando com engenheiros de dados, especialistas em GIS e biólogos.
Principais Atividades
Modelagem Preditiva Segmentada
Desenvolver modelos independentes (R1‑R5) usando XGBoost, RandomForest, entre outros.
Criar modelo agregador integrando os outputs especializados.
Incorporar transfer learning e telemática (velocidade, frenagem, etc.).
Feature Engineering & Dados Geoespaciais
Selecionar e transformar features críticas (curvatura, gradiente, faixas, clima, tipo veículo, etc.).
Clean, integrar e tratar grandes bases heterogêneas (rodovias, clima, fauna, acidentes).
Operar agregação espacial com H3, imputação por vizinhança e filtros para outliers.
Validação Avançada & Transferência
Implementar validação Leave-One-Corridor Out (LOCO).
Justificar o uso de gates de extrapolação e calibração Platt scaling.
Calibrar thresholds por tipo de acidente visando sensibilidade e precisão.
Interpretabilidade & Comunicação
Gerar explicabilidade de modelos usando SHAP (top features, dependências).
Elaborar relatórios mensais e dashboards técnicos.
Recomendar intervenções específicas baseadas em outputs analíticos.
Integração com Engenharia de Dados & Deploy
Colaborar em API REST, exportação de modelos e integração com bancos PostGIS/H3.
Apoiar design de ETL e operacionalização (on‑premise/nuvem).
Requisitos Obrigatórios
Formação superior em ciências exatas; necessário doutorado ou 6 anos de graduação concluída.
Forte experiência em machine learning aplicado (mínimo 2 anos prática, 3 anos em Python).
Experiência comprovada com dados geoespaciais (Geopandas, Shapely, PostGIS).
Proficiência em pandas, scikit‑learn, XGBoost, SHAP.
Sólida base de estatística, inferência, validação cruzada e métricas.
Experiência com bancos GIS; manuseio eficiente de dados espaciais.
Inglês técnico para compreensão de documentação e papers.
Diferenciais (Desejáveis)
Experiência com transfer learning, multi‑task learning.
Domínio de deploy de modelos via API (FastAPI, Flask) e cloud (GCP, AWS).
Vivência com telemática (dados GPS, séries temporais, LSTM, CNN).
Familiaridade com MLOps, MLflow, detecção e monitoramento de drift.
Experiência quantitativa em análise de segurança viária ou ecologia de estradas.
Proatividade no uso de IA generativa (ChatGPT, Copilot).
Soft Skills
Pensamento crítico, solução de problemas e autonomia analítica.
Capacidade de comunicação clara para equipes técnicas e não técnicas.
Facilidade para ambientes multidisciplinares (dados, GIS, fauna, engenharia).
Industries
Environmental Services
#J-18808-Ljbffr