Perfil do Candidato
* Nós estamos procurando por um profissional que tenha experiência em implementação e evolução de plataformas de observabilidade, conhecimento em logs, métricas e traces.
* O ideal é alguém com habilidades para liderar a definição e manutenção de painéis e alertas para serviços críticos da organização.
* Também precisamos de alguém capaz de estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados.
* Ao mesmo tempo, o candidato deve ter capacidade para automatizar respostas a alertas e reduzir toil por meio de scripts e integrações entre ferramentas.
* Além disso, ele deve ser capaz de atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.
* E, claro, ele deve apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.
* Também é importante desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.
* Finalmente, ele deve conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.
Habilidades e Qualificações
* Experiência em implementação e evolução de plataformas de observabilidade;
* Conhecimento em logs, métricas e traces;
* Habilidades para liderar a definição e manutenção de painéis e alertas;
* Capacidade para estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs);
* Habilidades para automatizar respostas a alertas e reduzir toil por meio de scripts e integrações entre ferramentas.
Vantagens
* Trabalho remoto disponível;
* Oportunidade de trabalhar em um time de profissionais excepcionais;
* Apoio contínuo à carreira e ao desenvolvimento profissional.