Especialista em soluções de alta confiabilidade

Eldorado do Sul

beBee Careers

Anunciada dia 16 junho

Descrição

Descrição do Cargo

Nossa empresa está em busca de um profissional experiente para atuar como Especialista em Confiabilidade e Desempenho. Este cargo é fundamental para garantir a estabilidade e performance dos nossos ambientes SaaS, promovendo automação e excelência operacional.

O Especialista em Confiabilidade e Desempenho será responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, promovendo uma cultura orientada a dados, automação e confiabilidade.

Missão

O Especialista em Confiabilidade e Desempenho terá como missão assegurar que nossos sistemas estejam sempre disponíveis, performáticos e seguros. Será responsável por definir e acompanhar SLIs/SLOs e indicadores de confiabilidade por produto e ambiente; atuar no design e melhoria contínua de pipelines de observabilidade (tracing, métricas e logs); liderar o processo de incident response, conduzir post-mortems e promover ações corretivas;

E também colaborar com times de desenvolvimento para garantir a resiliência desde o design da aplicação; automatizar tarefas operacionais, autoscaling e gestão de capacidade em ambientes em nuvem; participar da construção e disseminação de runbooks, playbooks e estratégias de disaster recovery; apoiar a cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas;

E utilizar ferramentas de análise de performance (APM) para diagnóstico e mitigação de gargalos.

Requisitos e Qualificações

* Experiência com Ambientes Multi-cloud (OCI e AWS) e suas ferramentas de gestão e automação;
* Sólida experiência em SRE, DevOps ou Engenharia de Produção em ambientes de missão crítica;
* Dominio em práticas de observabilidade: métricas, logs, tracing e alertas (ex: Datadog, Prometheus, Grafana, etc);
* Conhecimento avançado em automação e IaC (Terraform, Ansible, CDK ou semelhantes);
* Familiaridade com pipelines de CI/CD (ex: GitHub Actions, GitLab, Azure DevOps);
* Experiência com containers e orquestração (Docker, Kubernetes, ECS, EKS);
* Boa base em sistemas distribuídos, redes, escalabilidade e gerenciamento de capacidade;
* Mentalidade 'you build it, you run it', com foco em confiabilidade e colaboração entre times.

Diferenciais

* Certificações relevantes (ex: Google SRE, AWS DevOps Engineer, Kubernetes CKA/CKS);
* Experiência em ambientes com cultura de SRE madura (SLIs/SLOs, toil reduction, etc);
* Vivência com testes de caos e engenharia de resiliência (Chaos Monkey, Gremlin);
* Capacidade de análise de custos operacionais e otimização de uso da infraestrutura;
* Experiência com automação de testes de performance e de carga;
* Atuação anterior com feature flags, dark launches e blue/green deployments.

Benefícios

Nossos benefícios incluem participação nos resultados, vale alimentação, licença maternidade e paternidade estendida, auxílio creche, plano de saúde, plano odontológico, day OFF no aniversário, empréstimo consignado, Gympass / Wellhub, Zenklub e seguro de vida.

Ouvidoria

Não há área específica para reclamações, mas a empresa se compromete a responder a todas as questões ou problemas apresentados pelos funcionários de forma transparente e justa.

Se candidatar

Criar um alerta

Salvar