Garantir a confiabilidade, disponibilidade e resiliência dos sistemas e infraestruturas tecnológicas da operadora, assegurando a continuidade operacional e a eficiência dos serviços digitais. Isso será feito por meio da aplicação de práticas de engenharia de confiabilidade, automação, monitoramento e gestão estruturada de crises e incidentes.Responsabilidades e atribuiçõesComo nosso Especialista SRE você irá realizar:Engenharia de Confiabilidade:Projetar e manterarquiteturas robustas, identificar riscos e prevenir falhas, definindo e monitorandoSLOs, SLIs e SLAs.Gestão de Incidentes e Melhoria Contínua:Liderar aAnálise de Causa Raiz (RCA), propor melhorias estruturais e atuar como referência na resposta a incidentes e crises, conduzindopost-mortemspara aprendizado contínuo.Automação e Eficiência Operacional:Desenvolver e implementarsoluções de automação(IaC, scripts, ferramentas) para otimizar processos críticos de infraestrutura, promovendo padronização e eficiência.Monitoramento e Observabilidade:Arquitetar e mantersistemas de monitoramento robustos, garantindo detecção precoce de anomalias e visibilidade em tempo real.Escalabilidade e Performance:Projetar soluções de escalabilidade e realizar testes de carga para garantir a resiliência dos sistemas.Gestão de Fornecedores:Representar a área tecnicamente, validando SLAs e apoiando a definição de requisitos em contratações.Requisitos e qualificaçõesSuperior em Ciências de Computação, Sistemas de Informação ou outros equivalentes na área de Tecnologia de Informação, desejável Cursos de Especialização ou MBA em áreas afins.