Estamos procurando um profissional experiente em Observabilidade para reforçar nosso time de tecnologia. Nossa empresa é líder em conectividade profissional e estamos à procura de alguém que possa ajudar a elevar nossa plataforma de observabilidade.
Descrição do Cargo
Aqui está uma oportunidade única para quem busca desafios inovadores e contribuir com suas habilidades técnicas para o crescimento da nossa empresa.
* Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces;
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoiartatorias e relatórios técnicos com dados precisos de disponibilidade e incidentes;
Requisitos e Qualificações
Abaixo estão as principais habilidades e qualificações necessárias para atender ao perfil do cargo:
* Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace;
* Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares;
* Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker);