Professor de Observabilidade
Estamos à procura de um(a) profissional altamente qualificado para se juntar ao nosso time de especialistas em observabilidade. Como professor de observabilidade, você será responsável por ensinar e orientar nossos funcionários sobre as melhores práticas de monitoramento e diagnóstico de problemas.
Funções:
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir e padronizar indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados;
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas;
* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações;
* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas;
* Apoi ar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes;
Competências Requeridas:
* Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace;
* Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos;
* Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio;
* Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares;
* Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker);
* Integração com ferramentas de alerta e resposta a incidentes: Opsgenie, PagerDuty, VictorOps;
* Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell);
* Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis);
* Criação e manutenção de documentação operacional (runbooks, playbooks, checklists);
* Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade;
Qualificações Desejáveis:
* Certificações em observabilidade e confiabilidade: Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation;
* Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry;
* Experiência com Chaos Engineering e validação de resiliência;
* Participação em incidentes críticos com liderança técnica na resposta;
* Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos;
* Experiência com automação de runbooks e fluxos de resposta a incidentes;
* Familiaridade com práticas de FinOps e eficiência operacional em observabilidade;
* Participação em comunidades técnicas de SRE, DevOps e observabilidade;
* Contribuições para ferramentas ou boas práticas open source;
* Inglês técnico para leitura, escrita e participação em fóruns internacionais;
Modelo de Contratação:
* Contrato: Pessoa Jurídica (PJ)
* Modelo de atuação: 100% Remoto
],