Descrição da Vaga
Procuramos um(a) engenheiro(a) de IA com experiência em levar modelos do protótipo à produção. A base da carreira é engenharia de software robusta (back-end resiliente e microserviços) aplicada à arquitetura e escala de soluções com LLMs, RAG e APIs inteligentes. A missão do papel é integrar engenharia sólida e o estado-da-arte em IA para criar produtos que aprendem, interagem e resolvem problemas de maneiras novas, com foco em agentes conversacionais.
Atuação prática
* Arquitetar, desenvolver e escalar serviços e microserviços para inferência de LLMs e agentes conversacionais (texto/voz).
* Projetar e operar pipelines RAG (ingestão, chunking, indexação, embeddings, buscas híbridas) com vetores/KBs.
* Implementar tool/function calling, planners, memória de longo prazo e orquestração multi-agente.
* Desenvolver APIs e integrações para múltiplos canais (web, mobile, WhatsApp, voz) e sistemas de terceiros.
* Estabelecer observabilidade (tracing, logs, métricas), avaliações (A/B, offline evals) e guardrails (segurança, toxicidade, PII).
* Otimizar performance e custo (latência, throughput, caching, batching, quantização/streaming quando aplicável).
* Colaborar com produto e dados para transformar problemas reais em soluções de IA confiáveis em produção.
* Escrever testes automatizados, revisar código e contribuir para padrões de qualidade e CI/CD.
* Contratação via PJ
Requisitos
* Sólida experiência em engenharia de software back-end (Node.js e/ou Python), APIs REST/gRPC e microsserviços.
* Vivência em cloud (Azure/AWS/GCP), Docker/Kubernetes, versionamento (Git) e pipelines CI/CD.
* Experiência prática com LLMs em produção e RAG (ex.: LangChain/LangGraph).
* Conhecimento de mensageria/eventos (ex.: Kafka/RabbitMQ), cache e bancos (SQL/NoSQL).
* Noções de segurança/privacidade (mascaramento de dados, PII) e conformidade (ex.: LGPD).
* Boa comunicação, mentalidade colaborativa e foco em entrega sustentável.
Diferenciais
* Experiência com agentes conversacionais em produção (WhatsApp, voice bots, contact center) em startups brasileiras.
* Tracing/evals de LLM (ex.: Langfuse, Promptfoo, Ragas, DeepEval) e guardrails (políticas/safety).
* Fine-tuning/LoRA, embeddings proprietários, re-rankers e busca híbrida (BM25+densa).
* Contribuições open source e participação em comunidades de IA/engenharia.
Informações da Posição
* Contratação via PJ
* Modelo Híbrido – Belo Horizonte
Belo Horizonte, Minas Gerais, Brazil
#J-18808-Ljbffr