Missão
O Especialista SRE com foco em Observabilidade trabalhará na evolução da plataforma de observabilidade, consolidando métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes.
Atividades
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos;
* Estabelecer indicadores de confiabilidade (SLIs, SLOs) orientando decisões técnicas com base em dados;
* Automatizar respostas a alertas reduzindo o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance dos sistemas;
* Desenvolver boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.
Habilidades e Qualificações
* Excelente habilidade em programação e automação;