Missão:
O candidato ideal é um profissional altamente qualificado e experiente em observabilidade, capaz de liderar a evolução da plataforma de observabilidade.
Responsabilidades:
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs);
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Gestão de incidentes;
* Apoio às áreas de tecnologia e produto;
Requisitos:
* Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace;
* Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Rastreamento distribuído;
* Monitoramento de ambientes em nuvem e conteinerizados;
* Integração com ferramentas de alerta e resposta a incidentes;
* Automáticação de processos operacionais;
* Participação ativa em war rooms;
* Colaboração com times de desenvolvimento, infraestrutura e produto;