**Especialista SRE em Observabilidade
O nosso time de profissionais excepcionais está à procura de um(a) especialista SRE com foco em observabilidade para reforçar nosso quadro de tecnologia.
Buscamos alguém com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos, além de domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace.
Este profissional deve atuar de forma estratégica, propondo padrões técnicos, elevando a maturidade dos nossos sistemas e disseminando boas práticas de visibilidade, performance e resiliência em toda a organização.
* Implementar e evoluir a plataforma de observabilidade da empresa;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes;