 
        
        Descrição do Cargo
O Team é responsável por garantir a saúde, estabilidade e observabilidade dos sistemas,
atuando de forma proativa para prevenir falhas e responder rapidamente a Incidentes.
A Oportunidade
Você será responsável por liderar as Iniciativas de Observabilidade e Confiabilidade de Sistemas em nossa Infraestrutura Tecnológica,
e garantir que nossos sistemas críticos sejam resilientes, escaláveis e monitoráveis de forma proativa.
Responsabilidades Principais
Liderar a Arquitetura de Observabilidade no Brasil em Coordenação com as Equipes Regionais e Globais;
Implementar e Manter Ferramentas de Monitoramento, Rastreamento Distribuído e Análise de Logs,
foco em Elastic;
Trabalhar em Parceria com Equipes de SRE, DevOps e Desenvolvimento para Garantir que os Sistemas sejam Projetados com Observabilidade desde o Início;
Estabelecer e Acompanhar Métricas e Indicadores-Chave (SLIs, SLOs, SLAs) para os Sistemas e Serviços da Empresa;
Conduzir Análises de Desempenho e Identificar Oportunidades de Melhoria tanto nos Sistemas e Serviços da Empresa quanto na Arquitetura de Observabilidade;
Promover a Cultura de 'Monitoramento como Código' e Automação de Alertas;
Liderar Iniciativas de Capacitação Interna sobre Boas Práticas de Observabilidade;
Liderar as Equipes de Monitoração e SREs,
promovendo boas práticas de confiabilidade, observabilidade e automação;
Supervisionar a Resposta a Incidentes Críticos e Apoiar nas Análises de Causa Raiz;
Desenvolver e Manter Documentação Técnica e Planos de Resposta a Incidentes (Knowledge Base).