Buscamos profissional apaixonado por tecnologia e educação que atue em ambiente inovador, focado em resultados.
Responsabilidades:
* Definir SLOs, SLIs e dashboards de criticidade;
* Projetar estratégias de resiliência (circuit breaking, graceful degradation, fail-over);
* Desenhar e evoluir padrões de infraestrutura cloud-native;
* Automatizar provisionamento via IaC e garantir controles de segurança/compliance com Policy-as-Code;
* Orquestrar incident response end-to-end (alertas, on-call, blameless post-mortems) para reduzir MTTR;
* Padronizar coleta de métricas, traces e logs;
* Construir playbooks de resposta a incidentes;
* Evoluir pipelines de CI/CD;
* Implantar políticas de qualidade e SSDLC;
* Orquestrar progressive delivery (blue/green, canary, feature flags) com rollback automático guiado por métricas de impacto;
* Modelar topologias em nuvem (Transit Gateway, VPC Peering, Service Mesh);
* Especificar controles Zero-Trust, microsegmentação de rede e requisitos IPv6;
Requisitos:
Sólido background em Cloud: Kubernetes, IaC (Terraform/Pulumi), serviços gerenciados AWS/Azure/GCP. Disponibilidade para workshops, brown-bags, documentação arquitetural (ADR, C4).
Comunicação efetiva em inglês (conversação técnica com fornecedores).