CIENTISTA DE DADOS - MODELAGEM ESPACIAL DE CRÉDITOS DE BIODIVERSIDADE
OBRIGATÓRIO:
Você deve preencher o formulário disponível no link abaixo
https:
//striped-owner-101.Notion.Site/1ee1d5630e8e807d8cabdaf14e485a7e?pvs=105
SOMENTE SERÃO AVALIADOS(AS) CANDIDATOS(AS) QUE ENVIAREM SUAS INFORMAÇÕES NESTE NO LINK INFORMADO
CONTRATAÇÃO
Tipo de Bolsa:
Bolsa de Desenvolvimento Tecnológico DT-I — R$ 5.200,00 (Valores fixos conforme edital FAPEMIG;
sem negociação.
Contratação como pessoa física, sem vínculo CLT, MEI ou PJ.)
Local de Trabalho 100 % home-office, obrigatoriamente residente em Minas Gerais
Formação:
doutorado ou graduação e experiência equivalente (≥6 anos) em ciência de dados, modelagem espacial de dados ambientais ou áreas correlatas.
IMPORTANTE:
Estes requisitos são exigência da FAPEMIG, não sendo possível alterar qualquer ponto.
OBJETIVOS
A EnvironBIT desenvolve a metodologia Km de Proteção (KmP) para identificar trechos rodoviários com alto risco de atropelamentos. Os KmP são modelos preditivos definidos km a km que integram dados de atropelamento, variáveis biológicas/ecológicas e tipologias de rodovias, permitindo mapear mais de 400 mil km com 86 % de precisão sem precisar estudar cada trecho. Esses modelos substituem estudos de campo longos e custosos e entregam risco por horário do dia, consideram sazonalidade e avaliam o comportamento do motorista (redução de velocidade). A empresa ampliou essa abordagem para criar os Créditos de Fauna (CF). Inspirados nos créditos de carbono, os CF quantificam quantas vidas animais são preservadas quando motoristas reduzem a velocidade em trechos de risco;
a quantidade de créditos depende do nível de risco do Km percorrido e da velocidade do veículo em relação ao limite da via.
O profissional desta vaga liderará o desenvolvimento do algoritmo que calcula os Créditos de Fauna, integrando os modelos KmP com variáveis de comportamento do motorista. O algoritmo deve seguir padrões de medição, reporte e verificação (MRV) compatíveis com certificações internacionais e possibilitar tokenização dos créditos no futuro.
RESPONSABILIDADES
Mês 1 – Imersão e Planejamento
* Realizar imersão em Créditos de Fauna e Km de Proteção, consultando literatura científica, legislação de créditos de biodiversidade, reuniões com equipe interna e documentos internos da EnvironBIT. Compreender a relação entre risco, velocidade e vidas salvas.
* Mapear fontes de dados geoespaciais e de tráfego:
bases de atropelamentos, dados de volume e velocidade (sistemas U‑Safe, telemetria de frotas, APIs de trânsito), limites de velocidade e características das vias.
* Documentar pipeline de ingestão de dados e cronograma de entrega.
Meses 2‑4 – Protótipo do Algoritmo (versão 0.5)
* Aprender sobre nosso data warehouse geoespacial integrando KmP (variáveis de risco), dados de tráfego e telemetria (velocidade do veículo) e limites de velocidade.
* Desenvolver protótipo (v0.5) do algoritmo de Créditos de Fauna utilizando Python e bibliotecas como Pandas, NumPy, Scikit‑Learn, GeoPandas e PostGIS. O algoritmo deve calcular créditos ponderando o risco de cada quilômetro (KmP) e a mudança de comportamento dos motoristas.
* Definir métricas preliminares de performance (AUC, R²) e validar com dados históricos.
Meses 5‑6 – Algoritmo v0.8, Test Harness e Integração MRV
* Otimizar o algoritmo para atingir ≥80 % da meta de desempenho e cobrir ≥80 % do código com testes automatizados.
* Desenvolver pipeline MRV reprodutível, incluindo ETL transparente e logs para auditoria externa. Garantir compatibilidade com requisitos de certificação de créditos ambientais.
Meses 7‑8 – Algoritmo v1.0 e API Dockerizada
* Estabilizar o algoritmo (v1.0) e criar API REST para integração com o SaaS da EnvironBIT e sistemas de frotas.
* Empacotar a solução em container (Docker) e implementar CI/CD para deploy automatizado.
Meses 9‑10 – Algoritmo v2.0 e Tokenização
* Integrar novos fluxos de dados:
condições climáticas, dados de fauna (espécies sensíveis), densidade de tráfego e ocupação das vias. Testar abordagens de aprendizado de máquina avançadas (modelos de séries temporais, redes neurais geoespaciais) para melhorar a precisão.
* Trabalhar com a equipe de produtos para definir requisitos de tokenização dos Créditos de Fauna, explorando padrões de blockchain e contratos inteligentes.
Meses 10‑12 – Benchmarking, Robustez e Transferência de Conhecimento
* Conduzir tests de estresse para avaliar robustez sob diferentes cenários (tráfego intenso, variação de limites de velocidade, diferentes biomas). Comparar o algoritmo com abordagens de referência.
* Produzir manual técnico detalhado, realizar workshop interno e transferir conhecimento para equipes de engenharia, ecologia e negócios.
REQUISITOS ESSENCIAIS
* Modelagem preditiva e análise geoespacial:
mínimo de 3 anos de experiência em machine learning, preferencialmente em projetos envolvendo análise de risco ou impacto ambiental. Familiaridade com estatística espacial e algoritmos de regressão/classificação.
* Geoprocessamento e GIS:
expertise em GeoPandas, PostGIS, QGIS e manipulação de dados vetoriais/rasters. Capacidade de integrar dados de tráfego e mapas de risco.
* Programação avançada em Python (Pandas, NumPy, Scikit‑Learn, PyTorch/TensorFlow opcional) e bancos de dados SQL/NoSQL.
* Dados de tráfego e telemetria:
experiência com ingestão e tratamento de dados de velocidade de veículos, limites de vias, volume de tráfego e rotas.
* APIs e DevOps:
construção de APIs REST, containerização (Docker), versionamento, testes automatizados e ferramentas de CI/CD.
* Idioma:
inglês técnico para leitura de papers e documentação.
* Residência:
Minas Gerais (trabalho 100 % remoto) com internet estável;
sem vínculo CLT, MEI ouPJ.
SOFT SKILLS
* Rigor analítico e pensamento crítico para questionar suposições, identificar viés e assegurar a validade científica do algoritmo.
* Comunicação interdisciplinar para trabalhar com ecólogos, engenheiros de trânsito, cientistas de dados e gestores públicos.
* Proatividade para propor novas metodologias e otimizar pipelines;
capacidade de aprendizado contínuo.
* Visão sistêmica voltada para sustentabilidade e ESG, entendendo o impacto social e ambiental dos Créditos de Fauna e seu potencial de tokenização.