Estamos à procura de um profissional para liderar a implementação e evolução da plataforma de observabilidade.
O cargo exige habilidades técnicas avançadas em ferramentas como Zabbix, Elastic Stack e Dynatrace.
Aqui estão algumas das responsabilidades do cargo:
* Liderar a implementação e manutenção da plataforma de observabilidade.
* Definir e padronizar painéis e alertas para serviços críticos da organização.
* Desenvolver indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados.
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.