Um sistema confiável é essencial para qualquer organização que busque garantir a disponibilidade e o desempenho de suas soluções. A Pessoa Coordenadora de Site Reliability Engineering (SRE) é responsável por liderar iniciativas de confiabilidade, automação, escalabilidade e observabilidade em ambientes críticos.
Responsabilidades:
* Liderar a equipe de SRE, definindo prioridades, estratégias e garantindo alinhamento com os objetivos da organização.
* Projetar, implementar e manter arquiteturas escaláveis, resilientes e seguras na AWS.
* Promover automação contínua de infraestrutura e operações por meio de práticas modernas de IaC.
* Construir e manter pipelines de CI/CD com GitHub, GitHub Actions e Argo CD.
* Estruturar e evoluir soluções robustas de monitoramento e observabilidade.
* Atuar na gestão de incidentes, análise de causa raiz e implementação de ações corretivas e preventivas.
Requisitos e qualificações:
* Experiência prévia como coordenador técnico ou tech lead.
* Visão abrangente de arquitetura de cloud, com forte domínio dos principais serviços da AWS.
* Experiência em DevOps, com atuação em pipelines, automações, fluxos de deploy e suas diretivas.
* Conhecimento prático em GitHub, GitHub Actions, Argo CD e ferramentas de IaC.
* Experiência com soluções de monitoramento e observabilidade.
Benefícios:
* Participação nos lucros.
* Vale-refeição ou alimentação.
* Assistência médica.
* Assistência odontológica.
Otras vantagens:
* Bolsas de estudo de graduação e pós-graduação.
* Day off no aniversário.
* Convênio SESC.
* Convênio farmácia Univers.
* Universidade corporativa.
* Descontos em livros.
* Wellhub (Gympass).
* Programa Ninho.
* Valoriza - Programa de Recrutamento Interno.
A organização busca talentos diversos e valoriza a diversidade e a inclusão.
],