Desenvolvedor Sênior de Observabilidade
O time que você fará parte é responsável por garantir a saúde e estabilidade dos sistemas, atuando de forma proativa para prevenir falhas e responder rapidamente a incidentes.
A Oportunidade
Nossa equipe está em busca de um profissional altamente qualificado(a) para liderar as iniciativas de observabilidade e confiabilidade de sistemas em nossa infraestrutura tecnológica.
Você será responsável por garantir que nossos sistemas críticos sejam resilientes e escaláveis.
Responsabilidades Principais
* Liderar a arquitetura de observabilidade no Brasil em coordenação com as equipes regionais e globais;
* Implementar e manter ferramentas de monitoramento, rastreamento distribuído e análise de logs, com foco em Elastic;
* Trabalhar em parceria com equipes de SRE, DevOps e desenvolvimento para garantir que os sistemas sejam projetados com observabilidade desde o início;
* Estabelecer e acompanhar métricas e indicadores-chave (SLIs, SLOs, SLAs) para os sistemas e serviços da empresa;
* Conduzir análises de desempenho e identificar oportunidades de melhoria tanto nos sistemas e serviços da empresa quanto na arquitetura de observabilidade;
* Promover a cultura de "monitoramento como código" e automação de alertas;
* Liderar iniciativas de capacitação interna sobre boas práticas de observabilidade;
* Liderar as equipes de monitoração e SREs, promovendo boas práticas de confiabilidade, observabilidade e automação;
* Supervisionar a resposta a incidentes críticos e apoiar nas análises de causa raiz;
* Desenvolver e manter documentação técnica e planos de resposta a incidentes (Knowledge Base).
Habilidades e Qualificações Requeridas
O ideal seria ter experiência em ferramentas de observabilidade, busca, análise e visualização dos dados;
Liderança em equipes e iniciativas de SRE é fundamental.
Sólidos conhecimentos em Azure Cloud são necessários.
Vantagens
Certificação em Elastic pode ser uma vantagem.