Descrição da vaga:
Engenheiro de Aprendizado de Máquina Sênior
 * Anote e prepare conjuntos de dados para visão computacional;
 * Projete, treine, valide e otimize modelos de aprendizado profundo para classificação, detecção e segmentação de imagens;
 * Treine e implemente modelos YOLO (Você Só Olha Uma vez) para tarefas de detecção de objetos;
 * Desenvolva e mantenha pipelines de inferência para execução eficiente em produção;
 * Implemente práticas de Engenharia de Modelos: CI/CD de modelos, versionamento de dados e experimentos, monitoramento e re-treino automático;
 * Trabalhe em conjunto com engenheiros de software para integrar os modelos em sistemas e aplicações.
Requisitos Obrigatórios:
 * Cognição em Python em quaisquer das bibliotecas de ML/DL (PyTorch, TensorFlow, OpenCV);
 * Experiência prática com YOLO (treinamento e inferência em problemas de detecção de objetos);
 * Experiência sólida em visão computacional (classificação, detecção, segmentação);
 * Experiência em Engenharia de Modelos com quaisquer das ferramentas: AWS SageMaker Studio, MLflow, Kubeflow, Docker, Kubernetes, Airflow;
 * Cognição em boas práticas de engenharia de software (git, testes automatizados, ambientes reprodutíveis).
Diferenciais:
 * Experiência em dados estruturados: preparação de dataset, treinamento e inferência em problemas de regressão (ex.: regressão linear, regressão logística, árvores de decisão) e classificação tabular;
 * Análise exploratória de dados estruturados (ex.: análise das componentes principais - pca, análise de correlação, clustering com k-means);
 * Otimização de modelos para dispositivos de bordo (tensorrt, onnx, quantização);
 * Contribuições para projetos open source ou publicações técnicas.
Métricas e gráficos que deve saber interpretar:
 * Visão computacional (foco principal): mAP@0.5, mAP@0.5:0.95, curvas precision-recall (pr) e ap por classe, curva roc e auc, matriz de confusão, curvas de perda e acurácia durante o treinamento, distribuição de IoU (interseção sobre a união), learning curves (treino vs. validação);
 * Dados estruturados (como diferencial): gráficos de resíduos em regressão, curvas de calibração de probabilidade, feature importance, shap e pdp/ice plots, heatmaps de correlação e pca (scree plot, biplot);
 * Engenharia de Modelos / Produção: gráficos de detecção de drift de dados, distribuição de probabilidades de saída (overconfidence), métricas de latência/throughput, consumo de gpu/cpu/memória em inferência.