Contratamos Especialista em Observabilidade
A Ródio Tech está à procura de um profissional experiente e qualificado para assumir o papel de Especialista em Observabilidade. Este profissional será responsável por garantir que nossos sistemas estejam sempre disponíveis e funcionando corretamente.
Para esse cargo, buscamos alguém com experiência sólida em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Além disso, espera-se que o candidato tenha domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, além de ter conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.
O especialista em observabilidade será responsável por:
• Liderar a implementação e evolução da plataforma de observabilidade;
• Definir e padronizar painéis e alertas para serviços críticos da organização;
• Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
• Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
• Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
• Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
• Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
• Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
• Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
• Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes.
Os principais requisitos para o cargo incluem:
• Experiência sólida como SRE, Observability Engineer ou DevOps com foco em monitoramento;
• Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica;
• Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais;
• Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD;
• Capacidade de correlacionar dados de observabilidade com impacto no negócio;
• Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).
Além disso, considera-se uma vantagem:
• Certificações em observabilidade e confiabilidade;
• Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry;
• Experiência com Chaos Engineering e validação de resiliência;
• Participação em incidentes críticos com liderança técnica na resposta;
• Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.
Se você se identifica com essas características e deseja contribuir para a nossa equipe, é fundamenta ler as condições de contratação e aceitar os termos.