Estamos à procura de uma pessoa excepcional para se juntar a nossa equipe de profissionais altamente qualificados como Especialista SRE. A função envolve liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces em soluções robustas e garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes.
Principais Responsabilidades:
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.
Requisitos Essenciais:
* Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas;
* Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento;
* Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica;
* Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.
Desenvolver habilidades e conhecimentos:
* Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).
O candidato ideal é uma pessoa analítica, orientada a resultados, com forte senso de dono e capacidade de trabalhar colaborativamente com múltiplas áreas. É importante ter uma visão sistêmica e senso crítico para liderar projetos de melhoria contínua e contribuir para o sucesso da empresa.
Se você se identifica com esse perfil e busca uma oportunidade desafiadora, inscreva-se agora mesmo!