Descrição da Vaga:
Procuramos profissional talentoso para atuar como Especialista SRE com foco em Observabilidade, integrante do nosso time de excelência.
Para essa vaga, o candidato deve ter sólida experiência em engenharia de confiabilidade e monitoramento de ambientes distribuídos, além de gestão de incidentes críticos.
Eles devem possuir domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, assim como conhecimento profundo em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.
Como Especialista SRE, o profissional será responsável pela liderança da implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.
O mesmo deverá definir, padronizar e manter painéis e alertas para serviços críticos da organização.
As principais atividades incluem estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.
Automatizar respostas a alertas e reduzir toil por meio de scripts e integrações entre ferramentas é outra responsabilidade importante.
Além disso, o profissional também atuará na gestão de incidentes, triagem, coordenação de resolução, documentação e melhoria contínua.