Descrição da Vaga
O Engenheiro de Aprendizado de Máquina (Sênior) é responsável por projetar, treinar e validar modelos de aprendizado profundo para classificação, detecção e segmentação de imagens.
Responsabilidades:
* Anotar e preparar conjuntos de dados de visão computacional.
* Projetar, treinar, validar e otimizar modelos de aprendizado profundo para classificação, detecção e segmentação de imagens.
* Treinar e implementar modelos YOLO (Você Só Olha uma vez) para tarefas de detecção de objetos.
* Desenvolver e manter pipelines de inferência para execução eficiente em produção.
* Implementar práticas de MLOps: CI/CD de modelos, versionamento de dados e experimentos, monitoramento e re-treino automático.
* Trabalhar em conjunto com engenheiros de software para integrar os modelos em sistemas e aplicações.
Requisitos Obrigatórios:
* Conhecimento de Python em quaisquer das bibliotecas de ML/DL (PyTorch, TensorFlow, OpenCV).
* Experiência prática com YOLO (treinamento e inferência em problemas de detecção de objetos).
* Experiência sólida em visão computacional (classificação, detecção, segmentação).
* Experiência em MLOps com quaisquer das ferramentas: AWS SageMaker Studio, MLflow, Kubeflow, Docker, Kubernetes, Airflow.
* Conhecimento em boas práticas de engenharia de software (Git, testes automatizados, ambientes reprodutíveis).
Diferenciais:
* Experiência em dados estruturados: preparação de dataset, treinamento e inferência em problemas de regressão e classificação tabular.
* Análise exploratória de dados estruturados (PCA, análise de correlação, clustering com K-Means).
* Otimização de modelos para dispositivos de bordo (TensorRT, ONNX, quantização).
* Contribuições para projetos open source ou publicações técnicas.
Métricas e Gráficos que Deve Saber Interpretar:
* Visão computacional (foco principal): Curvas Precision-Recall e AP por classe; Curva ROC e AUC; Matriz de confusão; Curvas de perda e acurácia; Distribuição de IoU.
* Curvas de aprendizado (treino vs. validação).
* Dados estruturados (diferencial): gráficos de resíduos, curvas de calibração, feature importance, SHAP e PDP/ICE; heatmaps de correlação e PCA.
* MLOps / produção: gráficos de drift de dados; distribuição de probabilidades de saída (overconfidence); métricas de latência/throughput; consumo de recursos em inferência.