Estamos em busca de um(a) Machine Learning Engineer Pleno!
Buscamos uma pessoa com perfil técnico, proativo e curioso, com domínio prático em AWS, Python e LLMs como Claude, Mistral, Titan, entre outros. Que goste de explorar, construir e compartilhar conhecimento, atuando em equipe e com autonomia.
Responsabilidades:
• Implementar arquiteturas de dados escaláveis na AWS, seguindo as boas práticas do AWS Well-Architected Framework.
• Projetar e implementar soluções de IA Generativa utilizando AWS Bedrock e modelos como Claude, Llama, Mistral e Titan, integrando com dados proprietários e aplicações empresariais.
• Criar e manter pipelines GenAI para uso de modelos pré-treinados e fine-tuned, com foco em alta performance, segurança e governança de dados.
• Desenvolver aplicações RAG (Retrieval-Augmented Generation), conectando LLMs a bases vetoriais como OpenSearch, Pinecone ou RDS para enriquecer respostas com dados internos.
• Realizar fine-tuning leve e adaptação de modelos foundation para casos de uso específicos do negócio, com curadoria e preparação de datasets.
• Implementar estratégias de prompt engineering avançadas para otimizar o desempenho dos modelos generativos, explorando técnicas como prompt chaining, zero-shot, few-shot e funções tool-use.
• Automatizar e monitorar workflows de GenAI, utilizando ferramentas como SageMaker Pipelines, AWS Lambda e Step Functions, com foco em reprodutibilidade e rastreabilidade.
• Definir e aplicar métricas de avaliação de LLMs, como relevância semântica, grounding, toxicidade e fluência, apoiando decisões de escolha/modelo.
• Garantir práticas de observabilidade e custo-eficiência para workloads de GenAI, monitorando uso de tokens, tempo de resposta e impacto financeiro.
• Trabalhar em integração de GenAI com aplicações web, via APIs RESTful e SDKs Python, construindo agentes inteligentes que interajam com usuários e sistemas legados.
• Apoiar e orientar colegas de time em iniciativas de GenAI, promovendo disseminação de boas práticas e visão técnica alinhada com tendências do mercado.
Requisitos:
• Experiência com AWS Bedrock e utilização de LLMs como Claude, Mistral, Titan ou equivalentes.
• Conhecimento prático em prompt engineering e otimização de prompts para modelos generativos (instruções, system prompts, context injection).
• Experiência com aplicações RAG, incluindo uso de vector databases como OpenSearch, Pinecone ou outros mecanismos de busca semântica.
• Sólida base em Python voltado para GenAI (LangChain, boto3, pandas, etc.) e uso de notebooks para prototipação.
• Conhecimento de arquiteturas GenAI serverless utilizando Lambda, API Gateway, Step Functions e S3.
• Experiência com boas práticas de versionamento e documentação de experimentos com modelos generativos.
• Leitura técnica de inglês para consumo de documentação de modelos, APIs e papers recentes.
Competências Comportamentais:
• Curiosidade técnica e aprendizado contínuo em um campo em constante evolução como GenAI.
• Capacidade de comunicação clara e estruturada para documentar experimentos, explicar decisões técnicas e discutir trade-offs.
• Proatividade para resolver problemas abertos com pensamento analítico e experimental.
• Capacidade de trabalhar de forma autônoma e colaborativa, apoiando outros engenheiros e integrando IA generativa aos fluxos do negócio.
• Organização e atenção a detalhes na entrega de pipelines e aplicações sensíveis à performance e custo.
Benefícios da oportunidade:
• Vale Alimentação ou Refeição;
• Plano de saúde;
• Seguro de vida;
• Bônus por certificações AWS;
• Modelo de trabalho híbrido: flexibilidade para atuar presencialmente e remotamente;
• Oportunidade de crescimento em um ambiente inovador e colaborativo.
#J-18808-Ljbffr