Especialista em observabilidade

Sapiranga

beBeeObservabilidade

Anunciada dia 19 dezembro

Descrição

Contratamos Especialista em Observabilidade

A Ródio Tech está à procura de um profissional experiente e qualificado para assumir o papel de Especialista em Observabilidade. Este profissional será responsável por garantir que nossos sistemas estejam sempre disponíveis e funcionando corretamente.

Para esse cargo, buscamos alguém com experiência sólida em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Além disso, espera-se que o candidato tenha domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, além de ter conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.

O especialista em observabilidade será responsável por:

• Liderar a implementação e evolução da plataforma de observabilidade;
• Definir e padronizar painéis e alertas para serviços críticos da organização;
• Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
• Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
• Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
• Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
• Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
• Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
• Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
• Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.

Os principais requisitos para o cargo incluem:

• Experiência sólida como SRE, Observability Engineer ou DevOps com foco em monitoramento;
• Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica;
• Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais;
• Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD;
• Capacidade de correlacionar dados de observabilidade com impacto no negócio;
• Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).

Além disso, considera-se uma vantagem:

• Certificações em observabilidade e confiabilidade;
• Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry;
• Experiência com Chaos Engineering e validação de resiliência;
• Participação em incidentes críticos com liderança técnica na resposta;
• Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.

Se você se identifica com essas características e deseja contribuir para a nossa equipe, é fundamenta ler as condições de contratação e aceitar os termos.

Se candidatar

Criar um alerta

Salvar