Desenvolvemos uma oportunidade de carreira para um(a) Especialista em Confiabilidade e Observação, responsável por garantir a estabilidade e visibilidade dos nossos sistemas.
O nosso time está à procura de alguém com sólida experiência em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos. Um(a) profissional com domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, e com profundo conhecimento em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.
A atividade principal será a liderança na evolução da plataforma de observabilidade da empresa, consolidando métricas, logs e rastreamentos em soluções robustas, garantindo visibilidade em tempo real, diagnóstico preciso de falhas e resposta eficiente a incidentes.
As responsabilidades incluem:
* Liderar a implementação e evolução da plataforma de observabilidade.
* Definir, padronizar e manter painéis e alertas para serviços críticos da organização.
* Estar atento aos indicadores de confiabilidade (SLIs, SLOs) e orientar decisões técnicas com base em dados.
* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.
* Gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.
* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.
* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.
Para essa posição, procuramos alguém com:
* Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.
* Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento.
* Dominio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.
* Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.
* Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD.
* Capacidade de correlacionar dados de observabilidade com impacto no negócio.
* Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).
* Fluencia em automação com linguagens como Python, Shell Script, Go ou similares.
Bem-estar e qualidade de vida
Nossa equipe valoriza o bem-estar e a qualidade de vida do nosso pessoal. Oferecemos ambiente de trabalho aberto e colaborativo, com flexibilidade de horários e oportunidades de crescimento e desenvolvimento profissional.
],