Estamos procurando por um especialista de confiabilidade para se juntar a nosso time de profissionais excepcionais. A pessoa ideal é alguém que possa trabalhar estrategicamente, propor padrões técnicos e ajudar a elevar a maturidade dos nossos sistemas.
Aqui estão algumas das atividades que você precisará realizar:
1. Implementar e monitorar indicadores de confiabilidade (SLIs, SLOs) e serviços críticos da organização.
2. Definir e manter painéis e alertas para serviços críticos da empresa.
3. Estabelecer e acompanhar indicadores de confiabilidade, orientando decisões técnicas com base em dados.
4. Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.
5. Atuar na gestão de incidentes, triagem, coordenação de resolução, documentação e melhoria contínua.
6. Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.
7. Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.
8. Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.
9. Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.
10. Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.