Descrição do Cargo
O Especialista em SRE com foco em Observabilidade é responsável pela liderança da implementação e evolução da plataforma de observabilidade.
Além disso, ele irá definir, padronizar e manter painéis e alertas para serviços críticos da organização, estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.
Outras atividades incluem automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas, atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua,
Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas, desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações, conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações, evoluir continuamente o processo de detecção proativa e resposta rápida a falhas,
Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes e colaborar com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade.
-----------------------------------