**Especialista SRE em Observabilidade**: Buscamos profissional com expertise em monitoramento e manutenção de sistemas, focado na observabilidade.
Para atuar na implementação e evolução da plataforma de observabilidade, você será responsável por garantir a visibilidade em tempo real, realizar diagnósticos precisos de falhas e responder eficientemente a incidentes.
Entre as atividades a serem desenvolvidas estão liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces; definir, padronizar e manter painéis e alertas para serviços críticos da organização; automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas; atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.
Além disso, você será necessário apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas, desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações, conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.
Principais conhecimentos requeridos incluem observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace, criação, padronização e manutenção de dashboards operacionais, executivos e técnicos, implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio, rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares, monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).