Vaga: Site Reliability Engineer (SRE)
Local: Híbrido – São Paulo/SP
Formato de Contratação: CLT via Sempre IT
Escopo da Atuação
- Sustentação e confiabilidade de ambientes Cloud (Azure e AWS) de alta criticidade, envolvendo sites, áreas logadas e aplicativos móveis.
- Implementação de práticas de SRE como automação de infraestrutura, observabilidade, gestão de capacidade, resiliência e resposta a incidentes.
- Automatização de provisionamento e manutenção de infraestrutura com ferramentas como Terraform e CloudFormation.
- Gestão de ambientes com Kubernetes (EKS), promovendo escalabilidade, alta disponibilidade e performance contínua.
- Condução de análises postmortem e implementação de melhorias contínuas com foco em confiabilidade e eficiência operacional.
- Migração e integração de ambientes multicloud, incluindo onboarding de empresas adquiridas (GPS, Reliance), e reestruturação de workloads legados.
- Análise de custos e otimização financeira com práticas de FinOps: rightsizing, desligamento de recursos ociosos, reservas e análise de billing.
- Criação de alertas inteligentes para antecipação de falhas e suporte à tomada de decisão proativa.
Ferramentas & Tecnologias Utilizadas
Cloud & Orquestração:
Azure (WebApps, Application Gateway, etc.)
AWS (EC2, RDS, EKS, SQS, SNS, ECS)
VMWare vSphere Replication
IaC (Infrastructure as Code):
Terraform
AWS CloudFormation
Observabilidade & SRE:
Monitoramento ativo (CloudWatch, Azure Monitor, etc.)
Análise de incidentes e postmortem
Automação de processos operacionais
Capacity planning
Colaboração com times multidisciplinares:
Suporte direto a desenvolvedores, segurança e arquitetura
Participação ativa em projetos de migração, modernização e integração
Perfil Desejado
- Experiência sólida em ambientes cloud críticos, especialmente no setor financeiro.
- Vivência em migração de ambientes on-premise para cloud.
- Atuação como ponto focal de sustentação e confiabilidade, com ownership em projetos estratégicos.
- Capacidade analítica para sugerir melhorias e ações de otimização de custo/performance.
- Autonomia técnica e habilidade de navegar em ambientes dinâmicos e com múltiplos stakeholders.