Vaga: Cientista de Dados Sênior com Arquitetura de IA Generativa
Conhecemos a sua capacidade em liderar projetos complexos e aplicar inteligência artificial para solucionar problemas. Agora, procuramos um profissional que possa contribuir para o desenvolvimento de soluções avançadas utilizando grandes modelos de linguagem (LLMs) e técnicas de promptings, embeddings e RAG.
Como nosso Cientista de Dados Sênior, você será responsável por:
* Definir e evoluir a arquitetura de IA do produto, garantindo escalabilidade, rastreabilidade e explicabilidade.
* Liderar iniciativas com LLMs, embeddings e RAG (Retrieval-Augmented Generation) para geração de soluções seguras e contextualizadas.
* Aplicar fundamentos de estatística, probabilidade e algoritmos de Machine Learning (regressão, classificação, clusterização etc.) em análises e avaliações de performance.
* Orquestrar integrações entre sistemas judiciais, serviços em nuvem e provedores de IA.
* Projetar, implementar e monitorar pipelines envolvendo vector DBs e frameworks de GenAI (LangChain, LlamaIndex, Semantic Kernel, entre outros).
* Criar e refinar engenharia de prompts em cenários complexos e diversos.
* Traduzir resultados técnicos em insights claros e acionáveis, comunicando descobertas e limitações a públicos diversos (técnicos e executivos).
* Documentar experimentos, resultados e boas práticas, promovendo transparência e reprodutibilidade.
* Evangelizar o uso responsável e eficiente da IA, representando a empresa em talks, artigos e comunidades técnicas.
* Garantir compliance e anonimização de dados sensíveis, em linha com LGPD e regulamentações do setor público.
Requisitos e qualificações:
* Conhecimento em estatística, probabilidade e algoritmos de Machine Learning (regressão, classificação, clusterização etc.).
* Experiência prática com Grandes Modelos de Linguagem (LLMs) e técnicas de prompting, embeddings e RAG.
* Familiaridade com o ecossistema de GenAI, incluindo frameworks e bibliotecas que aceleram o desenvolvimento com LLMs e vector databases.
* Vivência em vector DBs (pgvector, OpenSearch, Pinecone, Milvus ou equivalentes).
* Sólida base em Python e Node/TypeScript para automações e integrações.
* Experiência em arquitetura em nuvem (AWS, Azure ou GCP).
* Conhecimento em segurança e privacidade de dados (LGPD, PII), em especial questões de anonimização.
* Capacidade de comunicar e apresentar insights complexos de forma clara para públicos técnicos e de negócio.
* Experiência anterior como arquiteto de soluções ou líder técnico em projetos complexos de IA.
Diferenciais:
* Experiência com evals automatizados e guardrails (Rebuff, NeMo Guardrails, Truera).
* Experiência com IA aplicada ao setor público ou jurídico.
* Publicações, talks ou contribuições em comunidades técnicas de IA.
* Histórico de contribuição em projetos InnerSource ou open source.