O que é um Engenheiro de Confiabilidade em Sistema?
Um engenheiro responsável por garantir a disponibilidade e escalabilidade dos sistemas e infraestruturas em produção.
Responsabilidades
* Mantenha a infraestrutura e os sistemas em produção com alta disponibilidade e escalabilidade.
* Aplique técnicas de automação para o deploy, provisionamento e gerenciamento de infraestrutura utilizando IaC (Infraestrutura como Código).
* Trabalhe em conjunto com as equipes de desenvolvimento para identificar gargalos e falhas e implementar soluções de confiabilidade.
* Gere ferramentas de monitoramento e alertas, incluindo Prometheus, Grafana e Datadog.
* Desenvolva e mantenha pipelines de CI/CD para eficiência no desenvolvimento e implantação de código.
* Gerencie e otimize o uso de recursos na cloud (AWS, GCP, Azure).
* Crie planos de recuperação de desastres e garanta a continuidade dos negócios em caso de falhas.
Conhecimentos e Experiências Necessários
* Experiência sólida com infraestrutura e automação usando Terraform, Ansible, Puppet ou Chef.
* Proficiência em linguagens de programação como Python, Go, Bash ou Ruby para automação de tarefas.
* Conhecimento em plataformas de cloud computing (AWS, GCP, Azure).
* Familiaridade com bancos de dados (SQL e NoSQL), com foco em escalabilidade e performance.
* Experiência com contêineres e orquestração (Docker, Kubernetes).
* Inglês fluente para comunicação integral.
Diferenciais
* Certificações em cloud computing ou SRE.
* Conhecimento de práticas de segurança e devsecops.
* Experiência com infraestrutura como código em ambientes híbridos.
* Familiaridade com redes e protocolos de comunicação.
Nossa empresa oferece benefícios adicionais, incluindo assistência médica, VR e VA flexíveis, gympass, parceria com o SESC, descontos em restaurantes e cursos técnicos.