 
        
        Seja especialista em soluções de recuperação de equilíbrio e desenvolvimento de agentes de IA integrados a produtos.
A nossa plataforma oferece serviços de inteligência artificial para diversas áreas e possibilita o desenvolvimento de soluções personalizadas.
 * Projetar e operar arquiteturas de alta disponibilidade para micro-serviços Python/ FastAPI, garantindo resiliência, segurança e observabilidade de ponta a ponta.
 * Automatizar infraestrutura (IAAC) com Terraform e gerenciar ambientes em Kubernetes (GKE) ou Cloud Run, habilitando escalabilidade sob demanda.
 * Criar e manter pipelines CI/CD (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros.
 * Implementar e evoluir SLIs/SLOs; instrumentar serviços com Prometheus, Grafana, OpenTelemetry e rastreabilidade distribuída.
 * Montorar, diagnosticar e otimizar bancos SQL (Postgres), caches (Redis) e bases vetoriais, focando em desempenho e custo.
 * Conduzir resposta a incidentes: alerta, mitigação, post-mortem, ações preventivas.
 * Capacitar o time: disseminar boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.
 * Participar do plantão (on-call) rotativo, mantendo a plataforma com o máximo de disponibilidade possível.