O nosso papel como Cientista de Dados é buscar por soluções inovadoras com base em Inteligência Artificial Generativa (Gen AI) para grandes volumes de dados.
No entanto, não apenas precisamos de uma sólida experiência com Gen AI, mas também de habilidades analíticas e capacidade de orientação a resultados.
Aqui estão as responsabilidades do nosso Cientista de Dados:
* Projetar e implementar soluções com base em LLMs (como GPT, Claude, LLaMA, etc.);
* Criar pipelines de dados para aplicações RAG, integrando bases estruturadas e não estruturadas com vetorização (embeddings);
* Fine-tuning de modelos, prompt engineering e avaliação de desempenho (incluindo métricas como perplexidade, grounding score e precisão semântica);
* Colaborar com times de engenharia, produto e design para transformar problemas de negócio em soluções baseadas em IA;
* Pesquisar e testar novas abordagens e ferramentas do ecossistema Gen AI; e Participar da definição de arquitetura e estratégia de IA da empresa.
Você também precisará ter conhecimento em:
* Ciência de dados e machine learning (Python, Pandas, Scikit-learn, etc.);
* Arquiteturas Gen AI e LLMs (Transformers, LangChain, LlamaIndex ou equivalentes);
* Vetorização de documentos (OpenAI, Cohere, Hugging Face, FAISS, Pinecone, etc.);
* Serviços de nuvem (AWS, Azure ou GCP);
* Pipelines de dados (Airflow, Databricks, Spark, etc.);
* Inglês intermediário/avançado para leitura técnica e comunicação com times globais.
Nosso ambiente é altamente colaborativo e estimula a criação de conteúdo e novas ideias. Caso você tenha interesse em se juntar a nós, considere seus requisitos abaixo:
* Experiência com frameworks de MLOps e ML pipelines;
* Participação em projetos de IA Generativa voltados para agentes autônomos, copilots ou automação de processos;