Descrição da Vaga
Estamos procurando por um profissional altamente qualificado para liderar as iniciativas de confiabilidade e gerenciamento de sistemas em nossa infraestrutura tecnológica.
O candidato deve ter experiência em ferramentas de monitoramento, busca, análise e visualização dos dados, além de liderar equipes e iniciativas de SRE.
A oportunidade é perfeita para quem está procurando novos desafios em uma empresa multinacional líder global no seu setor que investe em modernizar suas soluções digitais e nas operações de TI.
Responsabilidades Principais
* Liderar a arquitetura de confiabilidade na região em coordenação com as equipes regionais e globais.
* Implementar e manter ferramentas de monitoramento e rastreamento distribuído, com foco em Elastic.
* Trabalhar em parceria com equipes de SRE, DevOps e desenvolvimento para garantir que os sistemas sejam projetados com confiabilidade desde o início.
* Estabelecer e acompanhar métricas e indicadores-chave (SLIs, SLOs, SLAs) para os sistemas e serviços.
Além disso, o candidato deve ser capaz de promover a cultura de automação de alertas e supervisionar a resposta a incidentes críticos e apoiar nas análises de causa raiz.