Especialista em engenharia de confiabilidade

Diadema

beBee Careers

Anunciada dia 16 junho

Descrição

Estamos em busca de um profissional para reforçar nosso time de cloud e engenharia de confiabilidade.

Missão do Cargo

O objetivo é garantir que nossos sistemas estejam sempre disponíveis, performáticos e seguros.

Será responsável por aplicar princípios de engenharia de software para resolver desafios operacionais.

A cultura orientada a dados, automação e confiabilidade será fundamental para o sucesso.

Todas as vagas estão abertas para pessoas com deficiência.

* Definir e acompanhar SLIs/SLOs e indicadores de confiabilidade por produto e ambiente;
* Atuar no design e melhoria contínua de pipelines de observabilidade (tracing, métricas e logs);
* Liderar o processo de incident response, conduzir post-mortems e promover ações corretivas;
* Colaborar com times de desenvolvimento para garantir a resiliência desde o design da aplicação;
* Automatizar tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem;
* Participar da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery;
* Apoiar a cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;

Requisitos e Qualificações

* Experiência com ambientes multi-cloud (OCI e AWS) e suas ferramentas de gestão e automação;
* Sólida experiência em SRE, DevOps ou Engenharia de Produção em ambientes de missão crítica;
* Dominio em práticas de observabilidade: métricas, logs, tracing e alertas (ex: Datadog, Prometheus, Grafana, etc);
* Conhecimento avançado em automação e IaC (Terraform, Ansible, CDK ou semelhantes);
* Familiaridade com pipelines de CI/CD (ex: GitHub Actions, GitLab, Azure DevOps);
* Experiência com containers e orquestração (Docker, Kubernetes, ECS, EKS);
* Boa base em sistemas distribuídos, redes, escalabilidade e gerenciamento de capacidade;
* Mentalidade "you build it, you run it", com foco em confiabilidade e colaboração entre times.

Diferenciais

Certificações relevantes (ex: Google SRE, AWS DevOps Engineer, Kubernetes CKA/CKS);

Experiência em ambientes com cultura de SRE madura (SLIs/SLOs, toil reduction, etc);

Vivência com testes de caos e engenharia de resiliência (Chaos Monkey, Gremlin);

Capacidade de análise de custos operacionais e otimização de uso da infraestrutura;

Experiência com automação de testes de performance e de carga;

Atuação anterior com feature flags, dark launches e blue/green deployments.

Benefícios

Nossa empresa valoriza a individualidade e oferece benefícios que promovem liberdade, equilíbrio e bem-estar em todas as áreas da vida.

Participação nos resultados;

Vale alimentação/refeição iFood;

Licença maternidade e paternidade estendida;

Auxílio creche;

Plano de saúde;

Plano odontológico;

Day OFF no aniversário;

Empréstimo consignado;

Gympass / Wellhub;

Zenklub;

Seguro de vida;

Vale transporte;

Equipamentos fornecidos pela empresa;

Auxílio idiomas;

Auxílio graduação, pós-graduação, auxílio certificações, universidade corporativa.

Nossa jornada de crescimento nunca pára. Plano de Performance e Desenvolvimento Individual: plano personalizado para seu crescimento profissional.

Touchpoints de Evolução com a Liderança: encontros regulares com líderes para discutir seu progresso e desenvolvimento.

Se candidatar

Criar um alerta

Salvar