Objetivo da Vaga
Buscamos um especialista em Confiabilidade para garantir a disponibilidade, performance e segurança dos nossos sistemas. Nossa equipe de Cloud e Engenharia de Confiabilidade está expandindo e precisamos de alguém para reforçar esse time.
Aqui você terá a oportunidade de apoiar na resiliência desde o design da aplicação, definindo e acompanhando SLIs/SLOs e indicadores de confiabilidade por produto e ambiente. Além disso, você liderará o processo de incident response, conduzirá post-mortems e promoverá ações corretivas.
* Automatizar tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;
* Participar da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery;
* Apoiando a cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;