Especialista SRE em Observabilidade
O papel é responsável pela implementação e evolução de plataformas de observabilidade para visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes.
Responsabilidades:
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
* Aautomatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.
Habilidades e Qualificações:
Necessário conhecimento em observabilidade, automatização, integrações entre ferramentas e experiência em liderança de projetos.
Benefícios:
Candidato selecionado terá oportunidade de trabalhar em um time de profissionais experientes e contribuir para a inovação e evolução de uma plataforma de observabilidade robusta.
Outros:
A empresa valoriza a inovação e a criatividade e oferece condições de trabalho flexíveis e dinâmicas.