Garantir a saúde, estabilidade e observabilidade dos sistemas é fundamental para o sucesso da empresa.
Como especialista em segurança de sistemas, você será responsável por liderar as iniciativas de confiabilidade e observabilidade em nossa infraestrutura tecnológica.
As principais responsabilidades incluem:
* Liderar a arquitetura de observabilidade no Brasil;
* Implementar e manter ferramentas de monitoramento, rastreamento distribuído e análise de logs com foco em Elastic;
* Trabalhar em parceria com equipes de SRE, DevOps e desenvolvimento para garantir que os sistemas sejam projetados com observabilidade desde o início;
* Estabelecer e acompanhar métricas e indicadores-chave (SLIs, SLOs, SLAs) para os sistemas e serviços da empresa;
* Conduzir análises de desempenho e identificar oportunidades de melhoria tanto nos sistemas e serviços da empresa quanto na arquitetura de observabilidade;
Para ter sucesso, é necessário ter experiência em ferramentas de observabilidade, busca, análise e visualização dos dados, liderança de equipes e iniciativas de SRE, inglês avançado ou fluente, e sólidos conhecimentos em Azure Cloud.