O cargo de Engenheiro de Confiabilidade em Sites é responsável por garantir a disponibilidade e escalabilidade dos sistemas em produção, garantindo que as aplicações sejam implantadas de forma eficiente e confiável.
Essa posição exige uma forte compreensão de infraestrutura e automação, com experiência em ferramentas como Terraform, Ansible, Puppet ou Chef. Além disso, é necessário ter proficiência em linguagens de programação como Python, Go, Bash ou Ruby para automatizar tarefas.
Ao trabalhar como SRE, você será responsável por monitorar os sistemas, identificar gargalos e falhas e implementar soluções de confiabilidade. Isso inclui gerenciar ferramentas de monitoramento e alertas, implementar pipelines de CI/CD e otimizar o uso de recursos em nuvem.
Além disso, é necessário ter conhecimento profundo em plataformas de cloud computing (AWS, GCP, Azure) e familiaridade com bancos de dados (SQL e NoSQL), focado em escalabilidade e performance. Experiência com contêineres e orquestração (Docker, Kubernetes) também é necessária.
Ambientes híbridos e segurança são fundamentais para essa função, portanto, é desejável ter certificações em cloud computing ou SRE, além de conhecer práticas de segurança e devsecops.
Como benefícios, oferecemos assistência médica, VR e VA flexíveis, Gympass e Wellz, parceria com o SESC, descontos em restaurantes, cursos técnicos e ensino superior, escolas e plataformas de idiomas.
Precisamos encontrar alguém que tenha habilidades em programação, automação e conhecimento em tecnologia da informação para ajudar a melhorar nossos sistemas.
E agora, é hora de tomar a próxima etapa: conclua sua candidatura e responda ao nosso anúncio de emprego!
* Responsabilidades:
* Monitorar, manter e melhorar a infraestrutura e sistemas em produção, garantindo alta disponibilidade e escalabilidade;
* Automatizar processos de deploy, provisionamento e gerenciamento de infraestrutura (IaC - Infrastructure as Code);
* Trabalhar em conjunto com as equipes de desenvolvimento para identificar gargalos e falhas e implementar soluções de confiabilidade;
* Gerenciar ferramentas de monitoramento e alertas;
* Implementar e manter pipelines de CI/CD, garantindo eficiência no desenvolvimento e implantação de código;
* Gerenciar e otimizar o uso de recursos em cloud;
* Criar e executar planos de recuperação de desastres e garantir a continuidade dos negócios em caso de falhas;
* Colaborar na definição de SLAs e SLOs para garantir os padrões de serviço esperados.