Descrição da Oportunidade
Somos uma empresa multinacional líder global em seu setor, que está investindo em modernizar suas soluções digitais e operações de TI.
Nossa equipe é responsável por garantir a saúde, estabilidade e observabilidade dos sistemas, atuando de forma proativa para prevenir falhas e responder rapidamente a incidentes.
Aqui você terá a oportunidade de liderar as iniciativas de observabilidade e confiabilidade de sistemas em nossa infraestrutura tecnológica.
Responsabilidades Principais
* Liderar a arquitetura de observabilidade no Brasil em coordenação com as equipes regionais e globais;
* Implementar e manter ferramentas de monitoramento, rastreamento distribuído e análise de logs, com foco em Elastic;
* Trabalhar em parceria com equipes de SRE, DevOps e desenvolvimento para garantir que os sistemas sejam projetados com observabilidade desde o início;
* Estabelecer e acompanhar métricas e indicadores-chave (SLIs, SLOs, SLAs) para os sistemas e serviços da empresa;
* Conduzir análises de desempenho e identificar oportunidades de melhoria tanto nos sistemas e serviços da empresa quanto na arquitetura de observabilidade;
* Promover a cultura de "monitoramento como código" e automação de alertas;
* Liderar iniciativas de capacitação interna sobre boas práticas de observabilidade;
* Liderar as equipes de monitoração e SREs, promovendo boas práticas de confiabilidade, observabilidade e automação;
* Supervisionar a resposta a incidentes críticos e apoiar nas análises de causa raiz;
Habilidades Requisitadas
* Experiência em ferramentas de observabilidade, busca, análise e visualização dos dados;
* Ter liderado equipes e iniciativas de SRE;
* Inglês avançado/Fluente;
* Sólidos conhecimentos em Azure Cloud;
Habilidades Adicionais
* Conhecer da ferramenta Elastic;
* Espanhol avançado;