Descrição da Vaga
Especialista em Observabilidade, foco em gerenciar a experiência do usuário e garantir o desempenho dos sistemas. Com uma equipe colaborativa, analítica e orientada a resultados, buscamos alinhar os objetivos da empresa com a visão dos valores.
Atividades principais:
* Liderar a implementação e evolução de soluções para observabilidade, consolidando dados e métricas;
* Definir, padronizar e manter painéis e alertas para serviços críticos;
* Estabelecer indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir toil por meio de scripts e integrações entre ferramentas;
* Gerenciar incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads em análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoiar auditorias e relatórios técnicos com dados precisos.
Principais habilidades:
* Observabilidade ponta a ponta com Zabbix, Elastic Stack e Dynatrace;
* Criação de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs;
* Rastreamento distribuído com Dynatrace, OpenTelemetry ou similares;
* Monitoramento de ambientes em nuvem e conteinerizados;
* Integração com ferramentas de alerta e resposta a incidentes;
* Automação de processos operacionais e scripts;
* Colaboração com times de desenvolvimento e infraestrutura.