O Papel do Cientista de Dados em Gen AI
Local: Remoto, Tipo: CLT ou PJ | Tempo integral
Área: Ciência de Dados / IA / Inovação
Fundamentalmente, um cientista de dados com sólida experiência em Inteligência Artificial Generativa (Gen AI) é responsável por liderar projetos inovadores envolvendo grandes volumes de dados. Este profissional desenvolve soluções baseadas em LLMs (Large Language Models), implementa pipelines de dados para RAG (Retrieval-Augmented Generation) e atua em frentes estratégicas de IA voltadas à automação de processos, geração de conteúdo e otimização de decisões de negócio.
Responsabilidades Principais
* Projetar, desenvolver e implementar soluções baseadas em Gen AI, utilizando LLMs como GPT, Claude, LLaMA, etc.
* Criar pipelines de dados para aplicações RAG, integrando bases estruturadas e não estruturadas com vetorização (embeddings).
* Realizar fine-tuning de modelos, prompt engineering e avaliação de desempenho, incluindo métricas como perplexidade, grounding score e precisão semântica.
* Colaborar com times de engenharia, produto e design para transformar problemas de negócio em soluções baseadas em IA.
* Pesquisar e testar novas abordagens e ferramentas do ecossistema Gen AI.
* Participar da definição de arquitetura e estratégia de IA da empresa.
Requisitos Básicos
* Experiência sólida com ciência de dados e machine learning (Python, Pandas, Scikit-learn, etc.).
* Dominio de arquiteturas Gen AI e LLMs (Transformers, LangChain, LlamaIndex ou equivalentes).
* Conhecimento em vetorização de documentos (OpenAI, Cohere, Hugging Face, FAISS, Pinecone, etc.).
* Experiência com serviços de nuvem (AWS, Azure ou GCP).
* Experiência com pipelines de dados (Airflow, Databricks, Spark, etc.).
* Capacidade analítica e orientação a resultados.
* Inglês intermediário/avançado para leitura técnica e comunicação com times globais.
Vantagens Adicionais
* Experiência com frameworks de MLOps e ML pipelines.
* Participação em projetos de IA Generativa voltados para agentes autônomos, copilots ou automação de processos.
* Publicações ou contribuições para repositórios open-source da área.
* Conhecimento em UX para IA conversacional (chatbots, voicebots, copilots).