Experiência técnica
* Liderar iniciativas de confiabilidade, automação, escalabilidade e observabilidade em ambientes críticos, garantindo a excelência operacional dos nossos sistemas.
Ambiente de missão crítica
1. Liderar a equipe de SRE, definindo prioridades, estratégias e garantindo alinhamento com os objetivos da organização.
2. Projetar, implementar e manter arquiteturas escaláveis, resilientes e seguras na AWS, com domínio de serviços como EC2, EKS, Lambda, S3, VPC, Route 53, IAM, API Gateway, ALB/NLB, RDS, DynamoDB, além de práticas com CloudWatch, CloudTrail, CloudFormation e Terraform.
3. Promover automação contínua de infraestrutura e operações por meio de práticas modernas de IaC.
4. Construir e manter pipelines de CI/CD com GitHub, GitHub Actions e Argo CD.
5. Estruturar e evoluir soluções robustas de monitoramento e observabilidade, com foco em desempenho, disponibilidade e experiência do usuário.
6. Atuar na gestão de incidentes, análise de causa raiz e implementação de ações corretivas e preventivas.
7. Colaborar com times de engenharia e produto para garantir a confiabilidade e a escalabilidade das soluções.