Sobre a Vaga
O Site Reliability Engineering (SRE) é um profissional responsável pela construção e evolução de ambientes em nuvem utilizando infraestrutura como código, garantindo que os projetos sigam padrões de arquitetura, governança, segurança e boas práticas.
Este especialista atua na operação e sustentação de ambientes críticos, realizando análises profundas de disponibilidade, capacidade, performance e escalabilidade.
Responsabilidades:
* Construir e evoluir ambientes em nuvem;
* Auditar e implementar soluções de observabilidade;
* Implementar e manter métricas, dashboards e alertas;
* Diagnosticar e resolver incidentes complexos;
* Apoiar iniciativas de FinOps;
* Compartilhar conhecimento com o time.