Procuramos um Especialista em Manutenção da Rede para liderar o desenvolvimento de nossas ferramentas de observabilidade.
O ideal é que tenha habilidade e conhecimento em implementação, evolução e manutenção da plataforma, garantindo que atenda às necessidades dos usuários.
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Gerenciar incidentes de forma eficiente;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evluar continuamente o processo de detecção proativa e resposta rápida a falhas;