A nossa equipe de Site Reliability Engineer é responsável por garantir a disponibilidade e escalabilidade da infraestrutura em produção.
Além disso, essa pessoa deve ter conhecimento em linguagens de programação como Python, Go, Bash ou Ruby para automação de tarefas.
Experiência com ferramentas de monitoramento e observabilidade (Prometheus, Grafana, ELK Stack) é altamente valorizada.
O ideal é que você tenha conhecimento profundo em plataformas de cloud computing (AWS, GCP, Azure).
Familiaridade com bancos de dados (SQL e NoSQL), com foco em escalabilidade e performance, também é uma vantagem.
Por fim, experiência com contêineres e orquestração (Docker, Kubernetes) é necessária.
* Responsabilidades:
* Monitorar e manter a infraestrutura em produção;
* Automatizar processos de deploy, provisionamento e gerenciamento de infraestrutura;
* Trabalhar em conjunto com as equipes de desenvolvimento para identificar gargalos e falhas e implementar soluções de confiabilidade;
* Gerenciar ferramentas de monitoramento e alertas;
* Implementar e manter pipelines de CI/CD;
* Gerenciar e otimizar o uso de recursos em cloud;
* Criar e executar planos de recuperação de desastres e garantir a continuidade dos negócios.
Conhecimentos e Experiências
* Experiência sólida com infraestrutura e automação;
* Proficiência em linguagens de programação;
* Experiência com ferramentas de monitoramento e observabilidade;
* Conhecimento profundo em plataformas de cloud computing;
* Familiaridade com bancos de dados;
* Experiência com contêineres e orquestração;
Vamos considerar os seguintes diferenciais: certificações em cloud computing ou SRE; conhecimento de práticas de segurança e devsecops; experiência com infraestrutura como código em ambientes híbridos; familiaridade com redes e protocolos de comunicação.
Benefícios
* Assistência médica;
* VR e VA flexível;
* Gympass e Wellz;
* Parceria com o SESC;
* Descontos em restaurantes;
* Descontos em cursos técnicos e de ensinos superior;
* Descontos em escolas e plataformas de idiomas.