PRINCIPAIS RESPONSABILIDADES:
* Monitorar proativamente a infraestrutura de rede, servidores, aplicações e serviços utilizando ferramentas de monitoramento e observabilidade.
* Identificar e diagnosticar incidentes e problemas, acionando as equipes responsáveis conforme os procedimentos estabelecidos.
* Realizar o primeiro nível de troubleshooting para resolver problemas comuns e restaurar serviços rapidamente.
* Documentar incidentes, suas causas e as ações corretivas tomadas, mantendo registros precisos no sistema de gestão de tickets.
* Escalar problemas complexos para equipes de nível superior (Nível 2/3) e acompanhar a resolução.
* Participar da criação e atualização de playbooks, procedimentos operacionais padrão (SOPs) e bases de conhecimento.
* Contribuir para a melhoria contínua dos processos de monitoramento e resposta a incidentes.
* Gerar relatórios periódicos sobre o desempenho da infraestrutura e a ocorrência de incidentes.
CONHECIMENTO TÉCNIC
* O:Conhecimento em redes (roteamento, switching, firewalls), sistemas operacionais (Linux, Windows Server) e virtualização (VMware, Hyper-V
* ).Experiência prática com ferramentas de monitoramento e observabilidade, incluindo: Zabbix, Prometheus, Grafana, ELK Stack, Wazu
* h;Habilidade para realizar troubleshooting e identificar a causa raiz de problemas complexo
* s.Experiência com dashboards e alertas de monitorament
* o.Conhecimento em automação de tarefas (scripts em Bash, Python ou PowerShell) considerado diferencia
* l.Certificações na área de redes ou sistemas serão consideradas um diferencia