Descrição da Vaga
Nossa equipe procura por profissionais experientes para assumir o papel de Coordenador de SRE. Este profissional será responsável por liderar iniciativas de confiabilidade, automação e escalabilidade em ambientes críticos.
Responsabilidades:
1. Liderar a equipe de SRE, definindo prioridades e estratégias alinhadas com os objetivos da organização.
2. Projetar e implementar arquiteturas escaláveis e resilientes na AWS, com domínio de serviços como EC2, EKS, Lambda, S3, VPC, Route 53, IAM, API Gateway, ALB/NLB, RDS, DynamoDB, além de práticas com CloudWatch, CloudTrail, CloudFormation e Terraform.
3. Promover a automação contínua de infraestrutura e operações por meio de práticas modernas de IaC.
4. Construir e manter pipelines de CI/CD com GitHub, GitHub Actions e Argo CD.
5. Estruturar e evoluir soluções robustas de monitoramento e observabilidade, com foco em desempenho, disponibilidade e experiência do usuário.
6. Atuar na gestão de incidentes, análise de causa raiz e implementação de ações corretivas e preventivas.
7. Colaborar com times de engenharia e produto para garantir a confiabilidade e a escalabilidade das soluções.