Descrição do Cargo
A Especialista em Observabilidade de SRE trabalhará na evolução da plataforma de observabilidade para melhorar a confiabilidade dos sistemas e processos da empresa.
Funções Principais
* Liderar a implementação e evolução da plataforma de observabilidade;
* Definir, padronizar e manter painéis e alertas para serviços críticos, garantindo a transparência e a eficiência nas operações;
* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados reais e precisos;
* Automatizar respostas a alertas e reduzir o tempo por meio de scripts e integrações entre ferramentas, otimizando os fluxos de trabalho e melhorando a produtividade;
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas, identificando oportunidades de melhoria e melhorando a entrega de valor;
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações, garantindo a consistência e a qualidade das soluções implantadas;
* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas, minimizando impactos negativos e maximizando a disponibilidade dos sistemas;
* Apoiar auditorias e relatórios técnicos com dados precisos de disponibilidade e incidentes, fornecendo insights valiosos para a tomada de decisões estratégicas.
Competências e Habilidades Requeridas
* Experiência comprovada em engenharia de observabilidade e monitoramento de sistemas;
* Conhecimento profundo de tecnologias de monitoramento e gestão de alertas;
* Habilidades avançadas em programação e automatização de processos;
* Foco em resultados e habilidades de liderança para gerenciar equipes e projetos;
* Comunicação clara e eficaz para trabalhar em equipe e transmitir informações técnicas complexas;
* Critérios mínimos: graduação em Ciência da Computação ou áreas afins, mais de 5 anos de experiência em SRE, conhecimento avançado de Python, Docker, Kubernetes e Cloud.
Vantagens
* Oportunidade de trabalhar em uma empresa inovadora e líder no mercado;
* Ambiente de trabalho dinâmico e desafiador, com oportunidades de crescimento e desenvolvimento;
* Benefícios competitivos e seguro-saúde oferecidos pela empresa;
* Possibilidade de contribuir para o desenvolvimento de projetos e soluções inovadoras;
* Acesso a recursos e ferramentas avançadas para apoiar o desenvolvimento profissional.
O que você aprenderá
* Desenvolver habilidades em engenharia de observabilidade e monitoramento de sistemas;
* Aprender sobre tecnologias de monitoramento e gestão de alertas;
* Melhorar habilidades de programação e automatização de processos;
* Aprender a comunicar ideias e conceitos técnicos complexos de forma clara e eficaz;
* Aprofundar conhecimentos em áreas como ciência de dados, machine learning e inteligência artificial.