A Cientista de Dados é um profissional especializado em desenvolver soluções baseadas em modelos de linguagem.
O objetivo principal é implementar pipelines de dados para aplicativos de RAG (Retrieval-Augmented Generation), integrando bases estruturadas e não estruturadas com vetorização (embeddings).
* Projetar, desenvolver e implementar soluções baseadas em Gen AI, utilizando LLMs;
* Criar pipelines de dados para aplicações RAG, integrando bases estruturadas e não estruturadas com vetorização;
* Realizar fine-tuning de modelos, prompt engineering e avaliação de desempenho;
* Colaborar com times de engenharia, produto e design para transformar problemas de negócio em soluções baseadas em IA;
* Pesquisar e testar novas abordagens e ferramentas do ecossistema Gen AI;
* Participar da definição de arquitetura e estratégia de IA da empresa.
Habilidades e qualificações necessárias:
* Experiência sólida com ciência de dados e machine learning;
* Dominio de arquiteturas Gen AI e LLMs;
* Conhecimento em vetorização de documentos;
* Experiência com serviços de nuvem;
* Experiência com pipelines de dados;
* Capacidade analítica e orientação a resultados;
* Inglês intermediário/avançado para leitura técnica e comunicação com times globais.
Serão oferecidas oportunidades de crescimento e desenvolvimento profissional. A empresa prioriza a inovação e a visão de futuro.