Emprego
Meus anúncios
Meus alertas e-mail de emprego
Fazer login
Encontrar um emprego Dicas de emprego Fichas de empresas
Pesquisar

Especialista em observabilidade e confiabilidade

Rio Verde
beBeeSRE
Anunciada dia 19 dezembro
Descrição

Uma oportunidade excepcional!


Nós estamos à procura de um profissional experiente para atuar como Especialista em Confiabilidade e Observabilidade.


Fundamentalmente, o candidato deve ter experiência sólida em engenharia de confiabilidade, monitoramento de ambientes distribuídos e gestão de incidentes críticos.


Além disso, é esperado que tenha domínio técnico em ferramentas como Zabbix, Elastic Stack e Dynatrace, bem como conhecimento profundo em práticas modernas de observabilidade, rastreamento distribuído e automação de alertas.


O ideal é alguém que possa atuar de forma estratégica, propor padrões técnicos, elevar a maturidade dos nossos sistemas e disseminar boas práticas de visibilidade, performance e resiliência em toda a organização.



A atividade principal será:


* Liderar a implementação e evolução da plataforma de observabilidade, consolidando logs, métricas e traces.

* Definir, padronizar e manter painéis e alertas para serviços críticos da organização.

* Estabelecer e acompanhar indicadores de confiabilidade (SLIs, SLOs), orientando decisões técnicas com base em dados.

* Automatizar respostas a alertas e reduzir o toil por meio de scripts e integrações entre ferramentas.

* Atuar na gestão de incidentes: triagem, coordenação de resolução, documentação e melhoria contínua.

* Apoiar squads de produto e infraestrutura na análise de performance e comportamento dos sistemas.

* Desenvolver e disseminar boas práticas de observabilidade nos ciclos de desenvolvimento e operações.

* Conduzir treinamentos técnicos sobre métricas, rastreamento e diagnóstico de aplicações.

* Evoluir continuamente o processo de detecção proativa e resposta rápida a falhas.



Requisitos:

• Observabilidade ponta a ponta com Zabbix, Elastic Stack (Elasticsearch, Logstash, Kibana) e Dynatrace.

• Criação, padronização e manutenção de dashboards operacionais, executivos e técnicos.

• Implementação e monitoramento de SLIs, SLOs e SLAs alinhados a objetivos de negócio.

• Rastreamento distribuído (Distributed Tracing) com Dynatrace, OpenTelemetry, Jaeger ou similares.

• Monitoramento de ambientes em nuvem (AWS, Azure) e conteinerizados (Kubernetes, Docker).

• Integração com ferramentas de alerta e resposta a incidentes: Opsgenie, PagerDuty, VictorOps.

• Automação de processos operacionais e scripts para coleta e análise de dados (Python, Shell, PowerShell).

• Participação ativa em war rooms, execução de post-mortems e condução de RCA (Root Cause Analysis).

• Criação e manutenção de documentação operacional (runbooks, playbooks, checklists).

• Colaboração com times de desenvolvimento, infraestrutura e produto para antecipação de riscos e padronização de visibilidade.



Aqueles que sejam interessados devem ser capazes de demonstrar:


* Formação em Ciência da Computação, Engenharia, Sistemas de Informação ou áreas correlatas.


* Experiência sólida e comprovada como SRE, Observability Engineer ou DevOps com foco em monitoramento.


* Domínio técnico de Zabbix, Elastic Stack e Dynatrace em ambientes de missão crítica.


* Forte entendimento de arquitetura de sistemas distribuídos e métricas operacionais.


* Vivência com rastreamento distribuído e integração de logs/métricas em pipelines CI/CD.


* Capacidade de correlacionar dados de observabilidade com impacto no negócio.


* Experiência com cloud computing (AWS, Azure, GCP) e orquestração de contêineres (Kubernetes).


* Fluência em automação com linguagens como Python, Shell Script, Go ou similares.


* Excelente comunicação, organização e capacidade de trabalho colaborativo com múltiplas áreas.


* Visão sistêmica, senso crítico e iniciativa para liderar projetos de melhoria contínua.




Desejável:


* Certificações em observabilidade e confiabilidade: Dynatrace Associate, Zabbix Certified, Elastic Observability, SRE Foundation.


* Conhecimento em Prometheus, Grafana, Loki e OpenTelemetry.


* Experiência com Chaos Engineering e validação de resiliência.


* Participação em incidentes críticos com liderança técnica na resposta.


* Vivência com arquitetura de microserviços e desafios de visibilidade em ambientes distribuídos.


* Experiência com automação de runbooks e fluxos de resposta a incidentes.


* Familiaridade com práticas de FinOps e eficiência operacional em observabilidade.


* Participação em comunidades técnicas de SRE, DevOps e observabilidade.


* Contribuições para ferramentas ou boas práticas open source.


* Inglês técnico para leitura, escrita e participação em fóruns internacionais.





Modelo de Contratação:


Contrato: Pessoa Jurídica (PJ)



Modelo de Atuação:


Modelo: 100% Remoto


No RÓDIO TECH, conectamos os melhores profissionais às melhores vagas. Se você se identifica com esse perfil e busca uma oportunidade desafiadora em uma empresa que valoriza o talento e a inovação, inscreva-se agora mesmo.

Se candidatar
Criar um alerta
Alerta ativado
Salva
Salvar
Vagas parecidas
Emprego Rio Verde
Emprego Goiás
Emprego Centro-Oeste
Página principal > Emprego > Especialista em Observabilidade e Confiabilidade

Jobijoba Brasil

  • Dicas de emprego

Encontre vagas

  • Vagas de emprego por cargo
  • Pesquisa de vagas de emprego por área
  • Empregos por empresas
  • Empregos por localização

Contato / Parceria

  • Entre em contato
  • Publique suas ofertas no site Jobijoba

Menções legais - Menções legais e termos de uso - Política de dados - Gerir os meus cookies - Acessibilidade: Não conforme

© 2026 Jobijoba Brasil - Todos os direitos reservados

Se candidatar
Criar um alerta
Alerta ativado
Salva
Salvar