Responsabilidades
* Garantir Disponibilidade e Escalabilidade: Monitorar, manter e melhorar a infraestrutura e sistemas em produção para garantir alta disponibilidade e escalabilidade.
* Automatizar Processos: Automatizar processos de deploy, provisionamento e gerenciamento de infraestrutura utilizando ferramentas como Terraform, Ansible ou Chef.
* Trabalhar com Equipes de Desenvolvimento: Trabalhar em conjunto com as equipes de desenvolvimento para identificar gargalos e falhas e implementar soluções de confiabilidade.
* Gerenciar Ferramentas de Monitoramento: Gerenciar ferramentas de monitoramento e alertas (Prometheus, Grafana, Datadog).
Conhecimentos e Experiências
* Experiência sólida com infraestrutura e automação, utilizando ferramentas como Terraform, Ansible, Puppet ou Chef;
* Proficiência em linguagens de programação como Python, Go, Bash ou Ruby para automação de tarefas;
* Experiência com ferramentas de monitoramento e observabilidade (Prometheus, Grafana, ELK Stack);
* Conhecimento profundo em plataformas de cloud computing (AWS, GCP, Azure);
* Familiaridade com bancos de dados (SQL e NoSQL), com foco em escalabilidade e performance;
Diferenciais
* Certificações em cloud computing ou SRE (AWS Certified Solutions Architect, Google Professional Cloud Architect, etc.);
* Conhecimento de práticas de segurança e devsecops;
* Experiência com infraestrutura como código em ambientes híbridos;