Emprego
Meus anúncios
Meus alertas e-mail de emprego
Fazer login
Encontrar um emprego Dicas de emprego Fichas de empresas
Pesquisar

Especialista em confiabilidade e automação de sistemas

Cachoeiro de Itapemirim
beBee Careers
Anunciada dia 14 junho
Descrição

Buscamos um Especialista em Confiabilidade e Resiliência para reforçar nosso time de Engenharia de Produção.


Missão do Cargo

Sua missão será garantir a estabilidade e performance dos nossos ambientes SaaS, promovendo automação e excelência operacional em escala.

Você será responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, promovendo uma cultura orientada a dados, automação e confiabilidade.


Responsabilidades e Atribuições

* Definir e acompanhar indicadores de confiabilidade por produto e ambiente;
* Atuar no design e melhoria contínua de pipelines de observabilidade (tracing, métricas e logs);
* Liderar o processo de incident response, conduzir post-mortems e promover ações corretivas;
* Colaborar com times de desenvolvimento para garantir a resiliência desde o design da aplicação;
* Automatizar tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;
* Participar da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery;
* Apoiado à cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;
* Utilizar ferramentas de análise de performance (APM) para diagnóstico e mitigação de gargalos.


Requisitos e Qualificações

* Experiência com Ambientes Multi-cloud (OCI e AWS) e suas ferramentas de gestão e automação;
* Sólida experiência em SRE, DevOps ou Engenharia de Produção em ambientes de missão crítica;
* Dominio em práticas de observabilidade: métricas, logs, tracing e alertas (ex: Datadog, Prometheus, Grafana, etc);
* Conhecimento avançado em automação e IaC (Terraform, Ansible, CDK ou semelhantes);
* Familiaridade com pipelines de CI/CD (ex: GitHub Actions, GitLab, Azure DevOps);
* Experiência com containers e orquestração (Docker, Kubernetes, ECS, EKS);
* Boa base em sistemas distribuídos, redes, escalabilidade e gerenciamento de capacidade;
* Mentalidade 'you build it, you run it', com foco em confiabilidade e colaboração entre times.


Diferenciais

* Certificações relevantes (ex: Google SRE, AWS DevOps Engineer, Kubernetes CKA/CKS);
* Experiência em ambientes com cultura de SRE madura (SLIs/SLOs, toil reduction, etc);
* Vivência com testes de caos e engenharia de resiliência (Chaos Monkey, Gremlin);
* Capacidade de análise de custos operacionais e otimização de uso da infraestrutura;
* Experiência com automação de testes de performance e de carga;
* Atuação anterior com feature flags, dark launches e blue/green deployments.


Benefícios

* Participação nos Resultados (PPR);
* Vale Alimentação/Refeição iFood;
* Auxílio Creche;
* Plano de saúde;
* Plano odontológico;
* Day OFF no Aniversário;
* Empréstimo Consignado;
* Gympass / Wellhub;
* Zenklub;
* Seguro de Vida;
* Vale Transporte;
* Equipamentos Fornecidos pela Empresa;
* Auxílio Idiomas;
* Auxílio Graduação, Pós-Graduação, Auxílio Certificações, Universidade Corporativa;

Se candidatar
Criar um alerta
Alerta ativado
Salva
Salvar
Vagas parecidas
Emprego Cachoeiro de Itapemirim
Emprego Espírito Santo
Emprego Sudeste
Página principal > Emprego > Especialista em Confiabilidade e Automação de Sistemas

Jobijoba Brasil

  • Dicas de emprego

Encontre vagas

  • Vagas de emprego por cargo
  • Pesquisa de vagas de emprego por área
  • Empregos por empresas
  • Empregos por localização

Contato / Parceria

  • Entre em contato
  • Publique suas ofertas no site Jobijoba

Menções legais - Menções legais e termos de uso - Política de dados - Gerir os meus cookies

© 2025 Jobijoba Brasil - Todos os direitos reservados

Se candidatar
Criar um alerta
Alerta ativado
Salva
Salvar