Especialista em Segurança e Estabilidade de Redes
Buscamos um especialista para fortalecer nossa equipe de engenharia de confiabilidade e desenvolvimento de nuvem. Você será responsável por garantir a estabilidade, desempenho e resiliência de nossos ambientes SAAS, promovendo automatização e excelência operacional em escala.
O profissional definirá e acompanhará SLAs/SLOs e indicadores de confiabilidade por produto e ambiente; atuará no design e melhoria contínua de pipelines de observabilidade (tracing, métricas e logs); liderará o processo de resposta a incidentes, conduzirá post-mortems e promoverá ações corretivas.
Colaborará com times de desenvolvimento para garantir a resiliência desde o design da aplicação; automatizará tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;
Participará da construção e disseminação de runbooks, playbooks e estratégias de recuperação de desastres; apoiará uma cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas.
* Experiência com ambientes multi-cloud (OCI e AWS) e suas ferramentas de gestão e automação;
* Sólida experiência em SRE, DevOps ou Engenharia de Produção em ambientes de missão crítica;
* Domínio em práticas de observabilidade: métricas, logs, tracing e alertas (ex.: Datadog, Prometheus, Grafana, etc).
Para se candidatar, é necessário ter habilidades avançadas em gerenciamento de sistemas, conhecimento em programação e experiência com ferramentas de segurança e monitoramento. Além disso, é importante ter habilidades de comunicação eficaz e trabalhar bem em equipe.