1. Responsabilidades e Atribuições:
Gerenciar e evoluir a camada de AI Gateway que centraliza chamadas aos modelos (Azure OpenAI, AWS Bedrock, GCP Vertex AI), incluindo rate limiting, failover, cache e load balancing.
Provisionar, otimizar e monitorar serviços gerenciados de bases de conhecimento e vetoriais (AWS OpenSearch, Azure AI Search, AWS Knowledge Bases, Google Vertex AI Vector Search).
Atuar como especialista técnico em serviços de GenAI nas clouds AWS, Azure e GCP, gerenciando cotas, permissões (IAM) e configurações de segurança privada (VPCs, Private Links).
Implementar ferramentas de observabilidade e tracing para LLMs, monitorando latência, uso de tokens, custos e erros em tempo real.
Criar pipelines de automação e CI/CD que executem testes de código, avaliações de prompts (Evals) e regressão de modelos antes do deploy em produção.
Monitorar custos de inferência de IA, criando alertas de orçamento e propondo otimizações (FinOps de IA).
1. Requisitos Técnicos Obrigatórios:
Compreensão sólida de LLMs, embeddings, agentes e RAG.
Experiência prática com serviços de GenAI em cloud (Amazon Bedrock, Azure OpenAI Service ou Google Vertex AI).
Proficiência em Python para automações, SDKs de IA e pipelines.
Proficiência em TypeScript, especialmente em contextos de gateways e proxies.
Experiência com Infraestrutura como Código (Terraform).
Conhecimentos sólidos em Docker e Kubernetes (EKS, AKS ou GKE).
Entendimento profundo de APIs REST, gRPC e API Gateways (Kong, APIGee, Portkey, Helicone ou equivalentes).
1. Requisitos Técnicos Desejáveis (Diferenciais):
Certificação AWS Certified AI Practitioner.
Certificação Microsoft Certified: Azure AI Engineer Associate.
Certificação Google Cloud Professional Machine Learning Engineer.
Experiência com implementação de LLMs locais (vLLM, Ollama) em infraestrutura própria com GPUs.
Conhecimento em segurança de IA, incluindo OWASP Top 10 for LLM e proteção de dados sensíveis (PII masking em gateways).
1. Habilidades Comportamentais (Soft Skills):
Mentalidade de plataforma, com foco em construir ferramentas que aumentem a produtividade de outros desenvolvedores.
Resiliência operacional para investigação profunda de falhas e degradações de performance.
Curiosidade e postura cloud-agnostic para avaliar e recomendar serviços entre AWS, Azure e GCP.
1. Experiência Mínima:
No mínimo 4 anos de experiência em funções relacionadas à engenharia de plataformas, infraestrutura de cloud, MLOps/LLMOps ou áreas correlatas.
1. Observações Importantes:
O profissional deve ter entendimento mínimo sobre funcionamento e criação de agentes (low-code e com código), porém com foco principal na infraestrutura e na sustentação da plataforma em escala.