Especialista em Observabilidade
A RÓDIO TECH procura um profissional para ocupar o cargo de Especialista em Observabilidade, com foco em consolidar métricas, logs e rastreamentos em soluções robustas e garantir visibilidade em tempo real.
Para este papel, você precisará liderar a implementação e evolução da plataforma de observabilidade, definir e manter painéis e alertas para serviços críticos da organização e estabelecer indicadores de confiabilidade (SLIs, SLOs). Além disso, você precisará automatizar respostas a alertas, reduzir o toil por meio de scripts e integrações entre ferramentas e atuar na gestão de incidentes.
Se você se identifica como uma pessoa com conhecimento avançado em tecnologia e experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos, essa oportunidade pode ser ideal para você. Vamos trabalhar juntos para construir sistemas mais confiáveis e escaláveis!
Responsabilidades:
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir e manter painéis e alertas para serviços críticos da organização;
* Estabelecer indicadores de confiabilidade (SLIs, SLOs);
* Automatizar respostas a alertas;
* Reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes.
Conhecimentos e habilidades:
* Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace;
* Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares.
Perfil do candidato:
* Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas;
* Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento;
* Dominio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missao crítica;
* Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais;
* Vivencia com rastreamento distribuido e integração de logs/métricas em pipelines CI/CD.