Encontramos um profissional altamente especializado em Observabilidade com foco em garantir a confiabilidade e resiliência dos nossos serviços.
Aqui está uma oportunidade de crescimento para quem busca desenvolver habilidades avançadas em monitoramento de ambientes distribuídos, gestão de incidentes críticos e automação de processos operacionais.
Descrição do Cargo
Nossa equipe procura por um Especialista SRE com habilidades excepcionais em ferramentas como Zabbix, Elastic Stack e Dynatrace. Será responsável pela implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces em soluções robustas.
Além disso, é necessário definir, padronizar e manter painéis e alertas para serviços críticos da organização. Estabelecer indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados é outro ponto fundamental.
Também será responsável por automatizar respostas a alertas, reduzindo o toil por meio de scripts e integrações entre ferramentas.
Habilidades Requisitadas
* Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace;
* Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares;
* Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker);
Vantagens
Muitas oportunidades de crescimento e aprendizado; Envolvimento direto na evolução da nossa plataforma de observabilidade; Oportunidade de trabalhar em projetos colaborativos com outras equipes.
Obrigado por se candidatar!
],