Engenheiro de Dados Especialista II
São Paulo-SP
LLMOps Engineer / Engenheiro de Plataforma de IA
Estamos buscando um LLMOps Engineer para apoiar na sustentação e evolução da nossa fundação tecnológica de IA. Sua missão será garantir que nossas plataformas de AI Gateway e Orquestração de Agentes operem com alta disponibilidade, segurança e eficiência de custos. Você será o "braço direito" da infraestrutura para os times de desenvolvimento, provendo as ferramentas, acessos e monitoramento necessários para que eles construam soluções em cima das nossas plataformas. Você precisa entender como um Agente funciona minimamente (conceitos aprendidos e criação de agentes low-code e com código), mas seu foco diário será na "encanamento" que faz tudo isso funcionar em escala.
Atribuições principais:
Gestão de AI Gateway: Gerenciar e evoluir a camada de proxy que centraliza as chamadas aos modelos (Azure OpenAI, AWS Bedrock, GCP Vertex AI), configurando rate limiting, failover (fallback entre modelos), cache e load balancing.
Infraestrutura de RAG: Provisionar, otimizar e monitorar serviços gerenciados de Bases de Conhecimento e Vetoriais (ex: AWS OpenSearch, Azure AI Search, AWS Knowledge Bases e Google Vertex AI Vector Search).
Operação Multi-Cloud: Atuar como o especialista técnico nos serviços de GenAI das principais clouds (AWS, Azure, GCP), gerenciando cotas, permissões (IAM) e configurações de segurança privada (VPCs, Private Links) para acesso aos modelos.
Observabilidade de LLMs: Implementar ferramentas de tracing e monitoramento (como LangSmith, LangFuse, Arize ou Datadog AI, Grafana) para rastrear latência, uso de tokens, custos e erros em tempo real.
Automação e CI/CD para IA: Criar pipelines automatizados que não apenas testam código, mas que rodam avaliações (Evals) de prompts e regressão de modelos antes do deploy em produção.
FinOps de IA: Monitorar de perto os custos de inferência, criando alertas de orçamento e propondo otimizações.
Requisitos:
Fundamentos de Engenharia de IA: Compreensão sólida de como funcionam LLMs, Embeddings, Agentes e RAG, para dialogar com os desenvolvedores.
Domínio de Cloud Providers (GenAI): Experiência prática configurando serviços como Amazon Bedrock, Azure OpenAI Service ou Google Vertex AI.
Linguagens de Programação: Proficiência em Python (para scripts de automação, SDKs de IA e pipelines) e TypeScript (frequentemente usado em Gateways e proxies de borda).
Infraestrutura como Código (IaC): Experiência com Terraform, para provisionar recursos de IA de forma reprodutível.
Containerização e Orquestração: Sólidos conhecimentos em Docker e Kubernetes (EKS/AKS/GKE) para sustentar a plataforma de Agentes.
APIs e Gateways: Entendimento profundo de REST, gRPC e funcionamento de API Gateways (Kong, APIGee ou soluções específicas de IA como Portkey/Helicone).
Diferenciais:
Certificações de Nuvem (Altamente Desejadas):
Experiência com implementação de Local LLMs (vLLM, Ollama) em infraestrutura própria (GPUs) para redução de custo.
Conhecimento em segurança de IA (OWASP Top 10 for LLM, proteção de dados sensíveis/PII masking no gateway).
Mentalidade de Plataforma: Gosta de construir ferramentas que multiplicam a produtividade de outros desenvolvedores.
Resiliência Operacional: Não se contenta até entender por que uma requisição falhou ou por que a latência aumentou.
Curiosidade Cloud-Agnostic: Interesse em entender as nuances e diferenças entre os serviços da AWS, Azure e Google para recomendar a melhor ferramenta para o trabalho.
Formação Acadêmica Desejável:
Graduação em Ciência da Computação, Engenharia de Software, Engenharia de Redes, ou área técnica correlata.
Pós-graduação ou cursos de especialização em Machine Learning/IA, MLOps, ou Cloud Computing são considerados diferenciais.
Localidade da posição:
Por que construir sua carreira na Meta?
Oferecemos autonomia, metas claras e um ambiente dinâmico e desafiador, onde os profissionais têm oportunidade de interagir com diferentes tecnologias, participar de todos os tipos de projetos, trazer novas ideias e trabalhar de qualquer lugar do Brasil e (por que não?) do mundo. Além disso, somos uma das melhores empresas para se trabalhar no Brasil segundo o Great Place to Work e uma das 10 empresas que mais crescem no país há 3 anos consecutivos, segundo o Anuário Informática Hoje.
Quais são nossos valores?
- Somos pessoas servindo pessoas
- Pensamos e agimos como donos
- Crescemos e aprendemos juntos
- Buscamos excelência e a simplicidade
- Temos inovação e criatividade no nosso DNA
Todas as pessoas são bem-vindas independentemente de sua condição, deficiência, etnia, crença religiosa, orientação sexual, aparência, idade ou afins. Queremos que você cresça conosco em um ambiente acolhedor e repleto de oportunidades.
A Meta transforma negócios com inovação e tecnologia, guiando empresas por uma jornada de evolução, que combina estratégia, serviços com inteligência artificial e execução com precisão. Com 35 anos de atuação, a Meta oferece um portfólio abrangente e ágil, em que cada solução é testada e aperfeiçoada em nossa própria operação, garantindo que os clientes recebam resultados reais, práticos e escaláveis.
Na Meta, inovação não é apenas uma promessa: é o diferencial que aplicamos para simplificar a transformação digital, unindo o que há de mais avançado em tecnologia com a compreensão profunda dos desafios de cada cliente.
#J-18808-Ljbffr