Atividades
* Atuar em todas as etapas do ciclo de vida de ciência de dados: coleta, tratamento, modelagem, validação, deploy e monitoramento de modelos.
* Desenvolver e manter pipelines de Machine Learning (treinamento, inferência, versionamento e automação).
* Implementar pipelines de MLOps e LLMOps, incluindo CI/CD, controle de versionamento de dados, prompts e modelos e monitoramento de performance.
* Desenvolver soluções em Python, utilizando boas práticas de engenharia de software e reprodutibilidade.
* Construir e otimizar pipelines de dados integrando fontes diversas, garantindo qualidade e governança.
* Aplicar métodos estatísticos e técnicas de aprendizado supervisionado e não supervisionado para resolver problemas de negócio.
* Trabalhar em parceria com times de engenharia, produto e negócio, traduzindo desafios técnicos em resultados mensuráveis.
Requisitos
* Formação superior em Ciência da Computação, Engenharia, Estatística, Matemática ou áreas correlatas.
* Experiência em projetos de ciência de dados aplicados a negócios.
* Domínio em Python e bibliotecas de ciência de dados (pandas, numpy, scikit-learn, etc.).
* Experiência prática com MLOps (implementação de pipelines de ML, CI/CD, versionamento de modelos, deploy e monitoramento em produção).
* Conhecimento sólido em SQL e manipulação de bases de dados relacionais e não relacionais.
* Vivência com modelagem estatística e métricas de desempenho de modelos.
* Familiaridade com ferramentas de visualização de dados (Looker Studio, Power BI, Tableau ou similares).
Diferenciais:
* Experiência com Vertex AI Model Garden, experimentação com Gemini e tuning de modelos via Vertex AI.
* Certificações em Machine Learning, MLOps ou pipelines de ML em nuvem.
* Familiaridade com frameworks de orquestração e versionamento (Airflow, MLflow, Kubeflow, DVC, etc.).
* Conhecimento em integração com modelos de linguagem (LLMs), cache de prompts e otimização de custos de inferência de LLMs.
* Familiaridade com Red Teaming para LLMs e implementação de guardrails de segurança (Content Safety API).
* Experiência em deploy de modelos em containers utilizando Google Kubernetes Engine (GKE) ou Cloud Run.
* Espanhol ou inglês avançado.
Informações adicionais:
* Contratação CLT
* Atuação remota