Observability / Monitoring Analyst – Datadog (SRE-Oriented)
Modalidade: Remoto
Estamos em busca de um Analista de Observabilidade / Monitoramento com foco em SRE para atuar na administração de ferramentas de monitoramento (principalmente Datadog), trazendo eficiência, confiabilidade e evolução contínua para os sistemas monitorados.
Responsabilidades
– Administrar Datadog e demais ferramentas de monitoramento
– Criar e manter monitores e dashboards
– Investigar e atuar sobre alertas para apoiar a resolução de incidentes
– Identificar falhas recorrentes e lacunas de confiabilidade nos sistemas monitorados
– Documentar processos e transformá-los em procedimentos repetíveis e confiáveis
– Realizar análises proativas, sugerindo melhorias e otimizações em observabilidade
– Implementar boas práticas de monitoramento alinhadas a princípios de SRE
– Apoiar a evolução da estratégia de confiabilidade da empresa
Requisitos
– Perfil comunicativo e proativo
– Experiência sólida em ambientes de TI complexos (preferencialmente operações ou funções SRE)
– Vivência prática com ferramentas de monitoramento (Datadog é altamente desejável)
– Conhecimento em automação e scripting (Python, PowerShell ou Shell Script)
– Inglês técnico para participar de reuniões e se comunicar em contextos técnicos