Somos uma empresa comprometida com a inovação e a excelência em serviços de engenharia.
Estamos procurando por uma pessoa coordenadora de Site Reliability Engineering (SRE) para liderar nossas iniciativas de confiabilidade, automação e escalabilidade em ambientes críticos.
Responsabilidades
* Liderar a equipe de SRE, definindo prioridades e estratégias para garantir alinhamento com os objetivos da organização.
* Projetar e implementar arquiteturas escaláveis, resilientes e seguras na AWS, com domínio de serviços como EC2, EKS, Lambda, S3, VPC, Route 53, IAM, API Gateway, ALB/NLB, RDS, DynamoDB.
* Promover a automação contínua de infraestrutura e operações por meio de práticas modernas de IaC.
* Construir e manter pipelines de CI/CD com GitHub, GitHub Actions e Argo CD.
* Estruturar e evoluir soluções robustas de monitoramento e observabilidade, com foco em desempenho, disponibilidade e experiência do usuário.
A identificação correta dos problemas é fundamental. Para isso é necessário ter um perfil analítico e ser capaz de diagnosticar e resolver problemas complexos. Além disso, deve ter uma forte capacidade de comunicação e colaboração com outros times.
O que Você Pode Esperar Da Nós?
* Participação nos lucros e comemorações.
* Vale-refeição ou alimentação flexível.
* Assistência médica abrangente, incluindo dependentes.