Um profissional de alta qualidade é buscado para assumir o papel de Especialista em Suporte e Manutenção de Redes (SRE) com foco em Observabilidade. O candidato ideal será responsável por garantir a visibilidade e a resiliência dos sistemas da empresa.
Descrição do cargo:
Estamos procurando alguém que tenha experiência sólida em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com conhecimento profundo em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.
Atribuições:
* Garantir a visibilidade e a resiliência dos sistemas da empresa;
* Implementar e manter a plataforma de observabilidade da empresa, consolidando logs, métricas e traces;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.
Requisitos:
* Experiência sólida em engenharia de confiabilidade;
* Domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace;
* Conhecimento profundo em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas;
* Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes);
* Fluência em automação com linguagens como Python, Shell Script, Go ou similares;
* Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas;
* Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua;
* Certificações em observabilidade e confiabilidade (Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation).
Benefícios:
Um ambiente de trabalho dinâmico e desafiador, com oportunidades de crescimento e desenvolvimento profissional.
Outras informações:
Se você é um profissional experiente e motivado, estamos ansiosos para receber sua candidatura. Por favor, envie seu currículo e uma carta de apresentação explicando por que você é o candidato ideal para este papel.