MISSÃO DO CARGO:
Desenvolva soluções de agentes de inteligência artificial integrados a produtos em uma plataforma que fornece serviços para diversas áreas e possibilita o desenvolvimento de soluções.
O especialista projetará e operará arquiteturas de alta disponibilidade para micro-serviços, garantindo resiliência, segurança e observabilidade.
Automatizará infraestrutura (iac) com terraform e gerenciará ambientes em kubernetes ou cloud run, habilitando escalabilidade sob demanda.
Criará e manterá pipelines ci/cd que promovam builds, testes, deploy e rollback seguros.
Implementará e evoluirá slis/slos; instrumentará serviços com prometheus, grafana, open telemetry e rastreabilidade distribuída.
Monitorará, diagnosticará e otimizará bancos sql (postgres), caches (redis) e bases vetoriais, focando em desempenho e custo.
Conduzirá resposta a incidentes: alerta, mitigação, post-mortem, ações preventivas.
Capacitará o time: disseminará boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.
Participará do plantão (on-call) rotativo, mantendo a plataforma com o máximo de disponibilidade possível.