Descrição do Cargo
A posição de Engenheiro de Confiabilidade em Sistema busca profissionais experientes e motivados para trabalhar em projetos que envolvam a infraestrutura e sistemas em produção, garantindo alta disponibilidade e escalabilidade.
O candidato ideal deverá ter conhecimento avançado em linguagens de programação como Python, Go, Bash ou Ruby para automação de tarefas, além de experiência com ferramentas de monitoramento e observabilidade (Prometheus, Grafana, ELK Stack).
Além disso, é fundamental ter conhecimento profundo em plataformas de cloud computing (AWS, GCP, Azure) e familiaridade com bancos de dados (SQL e NoSQL), com foco em escalabilidade e performance.
Autorização para trabalhar em ambientes híbridos também será considerada uma vantagem.
-----------------------------------
Responsabilidades
* Monitorar, manter e melhorar a infraestrutura e sistemas em produção, garantindo alta disponibilidade e escalabilidade;
* Automatizar processos de deploy, provisionamento e gerenciamento de infraestrutura (IaC - Infrastructure as Code);
* Trabalhar em conjunto com as equipes de desenvolvimento para identificar gargalos e falhas e implementar soluções de confiabilidade;
* Gerenciar ferramentas de monitoramento e alertas (Prometheus, Grafana, Datadog);
* Implementar e manter pipelines de CI/CD, garantindo eficiência no desenvolvimento e implantação de código;
* Gerenciar e otimizar o uso de recursos em cloud (AWS, GCP, Azure);
* Criar e executar planos de recuperação de desastres e garantir a continuidade dos negócios em caso de falhas;
* Colaborar na definição de SLAs e SLOs para garantir os padrões de serviço esperados.
-----------------------------------
Conhecimentos e Experiências
* Experiência sólida com infraestrutura e automação, utilizando ferramentas como Terraform, Ansible, Puppet ou Chef;
* Proficiência em linguagens de programação como Python, Go, Bash ou Ruby para automação de tarefas;
* Experiência com ferramentas de monitoramento e observabilidade (Prometheus, Grafana, ELK Stack);
* Conhecimento profundo em plataformas de cloud computing (AWS, GCP, Azure);
* Familiaridade com bancos de dados (SQL e NoSQL), com foco em escalabilidade e performance;
* Experiência com conteners e orquestração (Docker, Kubernetes);
* Inglês para comunicação integral (leitura e escrita).
-----------------------------------
Diferenciais
* Certificações em cloud computing ou SRE (AWS Certified Solutions Architect, Google Professional Cloud Architect, etc.);
* Conhecimento de práticas de segurança e devsecops;
* Experiência com infraestrutura como código em ambientes híbridos;
* Familiaridade com redes e protocolos de comunicação (TCP/IP, DNS).