Especialista em Observabilidade de Sistemas
Procuramos um profissional especializado em monitoramento e análise de dados para auxiliar na evolução da plataforma de observabilidade da empresa.
* Liderar a implementação e manutenção de soluções de rastreamento e métricas;
* Definir e padronizar painéis de controle e alertas para serviços críticos;
* Estabelecer indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir toil por meio de scripts e integrações entre ferramentas;
* Participar da gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
Habilidades Requeridas:
* Tecnologias de monitoramento e análise de dados (Zabbix, Elastic Stack, Dynatrace);
* Criação e manutenção de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares;
* Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker);
* Integração com ferramentas de alerta e resposta a incidentes;
* Automação de processos operacionais e scripts para coleta e análise de dados;
O ideal é que o candidato tenha experiência comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento, domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica, além de habilidades de comunicação e trabalho colaborativo.