Oferta de Cargo
Procuramos por profissionais experientes em Engenharia de Confiabilidade, Monitoramento de Ambientes Distribuídos e Gestão de Incidentes Críticos para atuar como Especialista SRE com foco em Observabilidade.
Atividades: Implementar e Evoluir a Plataforma de Observabilidade, Consolidando Logs, Métricas e Traces. Definir, Padronizar e Manter Painéis e Alertas para Serviços Críticos da Organização.
* Estabelecer e Acompanhar Indicadores de Confiabilidade (SLIs, SLOs), Orientando Decisões Técnicas com Base em Dados.
* Automatizar Respostas a Alertas e Reduzir o Toil por Meio de Scripts e Integrações entre Ferramentas.
* Atuar na Gestão de Incidentes: Triagem, Coordenação de Resolução, Documentação e Melhoria Contínua.