Descrição da Função:
A função de Coordenadora de Site Reliability Engineering (SRE) é uma oportunidade para um profissional experiente em liderar iniciativas de confiabilidade, automação e escalabilidade em ambientes críticos.
O ideal candidato terá uma sólida experiência técnica e vivência anterior em posições de liderança, como coordenação de times ou atuação como tech lead. Além disso, terá domínio dos principais serviços da AWS e habilidades em DevOps, com atuação em pipelines, automações, fluxos de deploy e suas diretivas.
O coordenador SRE será responsável por liderar a equipe de SRE, definindo prioridades, estratégias e garantindo alinhamento com os objetivos da organização. Além disso, projetará, implementará e manterá arquiteturas escaláveis, resilientes e seguras na AWS, com domínio de serviços como EC2, EKS, Lambda, S3, VPC, Route 53, IAM, API Gateway, ALB/NLB, RDS, DynamoDB, além de práticas com CloudWatch, CloudTrail, CloudFormation e Terraform.
Outras responsabilidades incluem promover automação contínua de infraestrutura e operações por meio de práticas modernas de IaC, construir e manter pipelines de CI/CD com GitHub, GitHub Actions e Argo CD, estruturar e evoluir soluções robustas de monitoramento e observabilidade, com foco em desempenho, disponibilidade e experiência do usuário, atuar na gestão de incidentes, análise de causa raiz e implementação de ações corretivas e preventivas, e colaborar com times de engenharia e produto para garantir a confiabilidade e a escalabilidade das soluções.