Descrição do Cargo:
O nosso time de SRE é responsável por criar, manter e escalar soluções resilientes, de alta disponibilidade e performance em nuvem. Estamos procurando por alguém que possa ajudar a otimizar nossa infraestrutura e garantir que os nossos sistemas estejam sempre online.
Responsabilidades:
* Criar, manter e escalar soluções resilientes, de alta disponibilidade e performance em nuvem;
* Implementar e gerenciar fluxos de CI/CD com foco em automatização;
* Automatizar tudo que for possível (IaC, fluxos, deploys);
* Otimizar performance, definir e monitorar SLAs junto ao time de produto;
* Atuar em incidentes e ajudar a reduzir MTTR.
Habilidades Requeridas:
* Experiência prévia usando melhores práticas em SRE;
* Experiência em ambientes Multi-nuvem (OCI ou AWS) ou híbridos;
* Atuação com CI/CD (GitLab, ArgoCD e similares);
* Experiência sólida com Infraestrutura como Código (Terraform e similares);
* Automação e programação (Python, Go ou Bash/Shell);
* Conhecimento em observabilidade (Prometheus, Grafana LGTM, OTel);
* Domínio de contêineres e Kubernetes.
Vantagens:
* Experiência com Engenharia de Caos;
* Contribuições em projetos open source;
* Certificações em Nuvem.
Ambiente de Trabalho:
* Nossa equipe é dinâmica e inovadora;
* Possibilidades de crescimento e desenvolvimento profissional;
* Flexibilidade e autonomia no trabalho;
* Comunicação aberta e transparante.