Responsável por garantir a estabilidade e integração das plataformas de monitoramento e observabilidade em ambiente crítico. Soluções de monitoração e integração multi-sistemas, assegurando alta disponibilidade, performance e confiabilidade dos serviços. Responsabilidades Principais - Implementar, administrar e otimizar ambientes de Zabbix e Grafana em larga escala, garantindo coleta, análise e visualização de métricas. - Desenvolver integrações de baixa/média complexidade entre sistemas de monitoramento e ferramentas de automação. - Gerenciar bancos de dados PostgreSQL em cenários de alta disponibilidade (HA, replicação, particionamento e TimescaleDB). - Monitorar logs e eventos críticos utilizando Syslog, Elastic Stack e pipelines de observabilidade. - Propor melhorias contínuas, padronizações e automações que elevem o nível de maturidade operacional do ambiente. Requisitos Técnicos - Experiência comprovada de mínimo 3 anos em ambientes críticos e de missão essencial. - Experiência em Zabbix (avançado), Grafana, PostgreSQL e Linux. - Conhecimento em protocolos de rede e comunicação (SNMP, ICMP, HTTP, SSH, API REST, Syslog). - Conhecimento em integrações via API e troubleshooting em infra-estruturas híbridas. - Vivência em ambientes com automações via GitLab CI/CD. - Vivência em arquiteturas distribuídas. - Vivência em ambiente Azure. - Capacidade de documentação técnica e versionamento de código. Certificações Recomendadas - Zabbix Certified Specialist (ZCS) ou Zabbix Certified Professional (ZCP) - Cloud Architect (Azure) - LPIC1, LPIC2, RHCSA Diferenciais Desejáveis - Experiência com Elastic Stack, NetBox, APM ou soluções correlatas. - Conhecimentos em Python, JavaScript, Bash ou Go para automações customizadas. - Atuação anterior em times SRE, Tools, NOC ou DevOps. - Mentalidade voltada à confiabilidade, automação e melhoria contínua (Kaizen). Soft Skills Esperadas - Autonomia e postura proativa na resolução de incidentes e evolução de plataformas. - Capacidade analítica e raciocínio lógico avançado. - Clareza na comunicação técnica com times internos e clientes. - Comprometimento com a estabilidade, qualidade e eficiência operacional.