Descrição da Vaga
A posição de Site Reliability Engineer (SRE) envolve garantir confiabilidade, estabilidade e desempenho de sistemas críticos, atuando em ambientes de alta escala e colaborando com equipes de desenvolvimento e operações.
Responsabilidades
Garantir disponibilidade, desempenho e escalabilidade de serviços críticos em AWS e/ou Azure.
Desenvolver e implementar ferramentas e processos de automação (IaC, CI/CD, monitoramento, provisionamento, gestão de configuração).
Monitorar e gerenciar incidentes, participar de análises pós‑incidente.
Identificar e resolver gargalos de performance e pontos únicos de falha.
Colaborar na otimização da arquitetura e infraestrutura.
Definir e monitorar SLAs, SLOs, SLI e Error Budgets.
Manter pipelines CI/CD em Jenkins, Git e ferramentas similares.
Gerenciar clusters Kubernetes (AKS ou OpenShift) e automação de infraestrutura.
Implementar e manter sistemas de observabilidade (Prometheus, Grafana, Datadog, New Relic, CloudWatch).
Automatizar processos com Terraform, Ansible, Puppet, Chef ou outras soluções IaC.
Documentar e disseminar práticas de confiabilidade e cultura SRE.
Qualificações e Experiência
Licenciatura ou Mestrado em Ciência da Computação, Engenharia ou áreas relacionadas.
Experiência comprovada em SRE ou funções equivalentes.
Profundo conhecimento em ambientes cloud: AWS EC2 (instâncias, otimização, alta disponibilidade) e Azure (compute, storage, networking).
Experiência prática com Windows Server, Linux, Docker e Kubernetes.
Experiência em Jenkins, CI/CD pipelines, Git e gerenciamento de código.
Experiência com IaC: Terraform, CloudFormation, Ansible, Puppet, Chef.
Conhecimento em monitoração, logs, métricas (Prometheus, Grafana, Datadog, New Relic).
Conhecimento em SLO, SLI, SLA, Error Budget.
Certificações AWS (Solutions Architect, DevOps Engineer) e/ou Azure (AZ‑900, AZ‑104) são desejáveis.
Habilidades de Comunicação
Alto nível de comunicação e colaboração entre equipes multifuncionais.
Capacidade de trabalhar de forma independente e em equipe.
Boa análise de problemas e controle de versão.
Benefícios
Modelo híbrido (Barueri/SP, 2‑3 dias presenciais).
Vale refeição e vale alimentação flexíveis.
Assistência médica e odontológica.
Programas de qualidade de vida: ginástica laboral, day off de aniversário, apoio pessoal, entre outros.
Benefícios adicionais: Gympass, Wellhub, TotalPass, Clube de Vantagens, reembolso de fretado e transporte.
Inclusão e Diversidade
Todas as nossas oportunidades são inclusivas e abertas para pessoas com deficiência.
#J-18808-Ljbffr