Especialista em Confiabilidade de Rede
O cargo visa reforçar a equipe de engenharia de rede com um profissional experiente para garantir a estabilidade e resiliência dos ambientes em nuvem.
Missão do Cargo
A missão é assegurar que os sistemas estejam sempre disponíveis, performáticos e seguros. O especialista deve aplicar princípios de engenharia de software para resolver desafios operacionais e promover uma cultura orientada a dados, automação e confiabilidade.
Responsabilidades e Atribuições
1. Definir e acompanhar SLIs/SLOs e indicadores de confiabilidade por produto e ambiente;
2. Liderar o processo de incident response, conduzir post-mortems e promover ações corretivas;
3. Colaborar com times de desenvolvimento para garantir a resiliência desde o design da aplicação;
4. Automatizar tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;
5. Participar da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery;
6. Apoiar a cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;
Certificações e Experiência
* Certificações relevantes;
* Experiência em ambientes com cultura de SRE madura;
* Vivência com testes de caos e engenharia de resiliência;