Todas as nossas oportunidades são inclusivas e abertas para pessoas com deficiência.
Responsabilidades
Garantir a disponibilidade, performance e escalabilidade de nossos serviços críticos, com foco em infraestrutura baseada em AWS EC2 (Windows Server e Linux).
Desenvolver e implementar ferramentas e processos de automação para monitoramento, provisionamento, gestão de configuração e resolução de incidentes.
Identificar e solucionar gargalos de performance e pontos únicos de falha em nossos sistemas.
Colaborar com equipes de desenvolvimento e operações para otimizar a arquitetura e infraestrutura de nossos produtos.
Participar ativamente em análises pós-incidente para identificar causas raízes e implementar medidas preventivas.
Definir e monitorar SLAs e SLOs para garantir a qualidade dos nossos serviços.
Qualificações
Experiência comprovada como Engenheiro(a) de Confiabilidade de Site (SRE).
Profundo conhecimento de AWS EC2, Windows Server, Linux, Jenkins, Terraform, Ansible, Puppet, Chef, Prometheus, Grafana, Datadog, New Relic, CloudWatch.
Experiência com containers (Docker, Kubernetes) e CI/CD além de Jenkins.
Habilidade de comunicação e colaboração.
Certificações AWS (Solutions Architect, DevOps Engineer).
Experiência com Git.
Conhecimento de bancos de dados relacionais e não relacionais.
Benefícios
Vale Refeição/Vale Alimentação (flexível)
Assistência Médica
Plano de Saúde, Plano Odontológico, Seguro de Vida, Horário Flexível, Home Office, Gympass, Telemedicina.
#J-18808-Ljbffr