Aprenda a construir modelos de predição avançados para transformar decisões estratégicas e operacionais.
O seu papel será projetar e treinar modelos generativos aplicados à geração de conteúdo, assistência contextual e enriquecimento de dados.
Construa agentes de IA autônomos e integráveis, com capacidade de raciocínio, memória e interação com múltiplas fontes e APIs.
Atue em todo o pipeline de ciência de dados: definição do problema, coleta e preparação de dados, modelagem, validação, deployment e monitoramento.
Garanta qualidade, rastreabilidade e reprodutibilidade dos modelos, utilizando boas práticas de engenharia de machine learning (MLOps).
Ser referência técnica dentro do time, colaborando com engenheiros(as) de dados, produto e áreas de negócio.
Promova a melhoria contínua dos processos de ciência de dados, contribuindo com ferramentas, frameworks e boas práticas.
Estimule e apoie a cultura data-driven e data-centric, compartilhando conhecimento técnico com o time e stakeholders.
O que você precisa:
* Ensino superior completo em Ciência da Computação, Engenharia, Estatística, Matemática ou áreas correlatas.
* Modelos preditivos supervisionados (regressão, árvores, ensemble, redes neurais, etc.).
* Modelos generativos (LLMs, transformers, GANs, VAEs, Diffusion Models).
* Construção de agentes de IA autônomos com frameworks como LangChain, Haystack, Semantic Kernel, AutoGen ou similares.
* Linguagem Python, com uso avançado de bibliotecas como scikit-learn, TensorFlow, PyTorch, Hugging Face, Transformers.
* SQL e NoSQL, além de experiência com dados não estruturados.
* Estatística aplicada, métricas de avaliação e validação de modelos.
* Práticas de MLOps (MLflow, Airflow, Docker, APIs, CI/CD).
* Experiência em ambientes cloud (AWS, Azure, GCP).
* Leitura técnica em inglês para implementação de ferramentas e bibliotecas.
O que é legal ter?
* Pós-graduação ou especialização em IA, Ciência de Dados ou áreas correlatas.
* Experiência prática com RAG (Retrieval-Augmented Generation) em soluções reais.
* Vivência com LangChain Agents, AutoGen ou Semantic Kernel além do básico.
* Familiaridade com domínio fiscal, especialmente no contexto do ERP PROTHEUS.