Descrição da Vaga:
A Rodio Tech procura por um Especialista SRE com foco em Observabilidade para desenvolver e melhorar a plataforma de observabilidade.
Responsabilidades:
1. Liderar a implementação e evolução da plataforma de observabilidade;
2. Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
3. Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
4. Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
5. Autorizar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
6. Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
7. Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
8. Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
9. Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
10. Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.