Descrição da Vaga:
Responsabilidades
* Desenvolver soluções baseadas em LLMs, incluindo RAG (Retrieval-Augmented Generation).
* Projetar e implementar pipelines de indexação, recuperação e ranking de informação.
* Criar e otimizar prompts visando qualidade, consistência e segurança das respostas.
* Construir APIs de IA utilizando FastAPI.
* Integrar modelos de linguagem a sistemas existentes.
* Desenvolver e manter pipelines de dados e inferência.
* Avaliar e monitorar desempenho de sistemas de IA em produção.
* Trabalhar em ambiente ágil seguindo práticas de SCRUM.
Requisitos:
* Python + ML/DL (PyTorch)
* SQL + modelagem de dados
* Estatística
* LLMs + RAG + embeddings
* APIs de IA (OpenAI, etc.)
* Docker + Git
* Cloud (AWS/GCP/Azure)
* MLOps / LLMOps
Diferenciais:
* Vector DBs (Pinecone, Weaviate, PGVector)
* LangChain / LlamaIndex
* Sistemas de recomendação modernos
* Avaliação de LLMs