Conhecemos a importância de uma equipe que valorize Observabilidade. Nossa busca é por profissionais excepcionais para liderar a implementação e evolução da plataforma.
Funções Principais
* Implementar e melhorar observabilidade em todos os níveis, integrando Zabbix, Elastic Stack e Dynatrace;
* Desenvolver, padronizar e manter dashboards operacionais, executivos e técnicos;
* Definir SLIs, SLOs e SLAs alinhados com objetivos de negócio e estabelecer indicadores de confiabilidade;
* Autorizar scripts e integrações entre ferramentas para automatizar respostas a alertas e reduzir o toil;
* Liderar a gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
Habilidades Requeridas
* Obrigatórias:
o Observabilidade ponta a ponta com Zabbix, Elastic Stack e Dynatrace;
o Criação e manutenção de dashboards para executores, operadores e gerentes;
o Implementação e monitoramento de SLIs, SLOs e SLAs para garantir atendimento aos objetivos do negócio;
* Desejáveis:
o Certificações em observabilidade e confiabilidade; conhecimento em Prometheus, Grafana, Loki e OpenTelemetry;