Buscamos um especialista de alta qualidade para fortalecer nossa equipe
Nossa empresa está procurando por alguém que possa trabalhar em observabilidade e monitoramento, com foco em tecnologias como Zabbix, Elastic Stack e Dynatrace.
Para essa posição, estamos procurando alguém com habilidades técnicas avançadas e experiência em engenharia de confiabilidade. É importante ter domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.
A pessoa ideal para essa vaga é aquela que é analítica, orientada a resultados e tem forte senso de dono. Além disso, é fundamental ter capacidade de trabalho colaborativo com múltiplas áreas e visão sistêmica.
Entre as atividades a serem desenvolvidas estão:
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes;
Algumas das qualificações desejáveis incluem:
* Experiência em ferramentas de observabilidade e confiabilidade;
* Conhecimento em tecnologias como Prometheus, Grafana, Loki e OpenTelemetry;
* Participação ativa em comunidades técnicas de SRE, DevOps e observabilidade;