Responsável por garantir a estabilidade e integração das plataformas de monitoramento e observabilidade em ambiente crítico.
Soluções de monitoração e integração multi-sistemas, assegurando alta disponibilidade, performance e confiabilidade dos serviços.
Responsabilidades Principais
- Implementar, administrar e otimizar ambientes de Zabbix e Grafana em larga escala, garantindo coleta, análise e visualização de métricas.
- Desenvolver integrações de baixa/média complexidade entre sistemas de monitoramento e ferramentas de automação.
- Gerenciar bancos de dados PostgreSQL em cenários de alta disponibilidade (HA, replicação, particionamento e TimescaleDB).
- Monitorar logs e eventos críticos utilizando Syslog, Elastic Stack e pipelines de observabilidade.
- Propor melhorias contínuas, padronizações e automações que elevem o nível de maturidade operacional do ambiente.
Requisitos Técnicos
- Experiência comprovada de mínimo 3 anos em ambientes críticos e de missão essencial.
- Experiência em Zabbix (avançado), Grafana, PostgreSQL e Linux.
- Conhecimento em protocolos de rede e comunicação (SNMP, ICMP, SSH, API REST, Syslog).
- Conhecimento em integrações via API e troubleshooting em infra-estruturas híbridas.
- Vivência em ambientes com automações via GitLab CI/CD.
- Vivência em arquiteturas distribuídas.
- Vivência em ambiente Azure.
- Capacidade de documentação técnica e versionamento de código.
Certificações Recomendadas
- Zabbix Certified Specialist (ZCS) ou Zabbix Certified Professional (ZCP)
- Cloud Architect (Azure)
- LPIC1, LPIC2, RHCSA
Diferenciais Desejáveis
- Experiência com Elastic Stack, NetBox, APM ou soluções correlatas.
- Conhecimentos em Python, JavaScript, Bash ou Go para automações customizadas.
- Atuação anterior em times SRE, Tools, NOC ou DevOps.
- Mentalidade voltada à confiabilidade, automação e melhoria contínua (Kaizen).
Soft Skills Esperadas
- Autonomia e postura proativa na resolução de incidentes e evolução de plataformas.
- Capacidade analítica e raciocínio lógico avançado.
- Clareza na comunicação técnica com times internos e clientes.
- Comprometimento com a estabilidade, qualidade e eficiência operacional.