Sobre a oportunidade
Buscamos um(a) SRE com forte atuação em Microsoft Azure, capaz de garantir a confiabilidade, escalabilidade e eficiência das nossas plataformas em produção.
Essa pessoa será peça-chave na evolução da nossa maturidade operacional, atuando na automação de processos, observabilidade, gestão de incidentes e melhoria contínua da infraestrutura.
Se você gosta de resolver problemas complexos, reduzir ruído operacional e construir sistemas resilientes, essa posição é para você.
Responsabilidades
* Garantir alta disponibilidade e performance das aplicações em produção
* Atuar na resposta a incidentes, análise de causa raiz (RCA) e prevenção de recorrências
* Implementar e evoluir práticas de observabilidade (logs, métricas e tracing)
* Automatizar processos operacionais e rotinas de infraestrutura (Infrastructure as Code)
* Trabalhar em conjunto com times de desenvolvimento para melhorar a resiliência e escalabilidade das aplicações
* Gerenciar e otimizar custos em ambiente cloud (FinOps básico já ajuda muito)
* Evoluir pipelines de CI/CD com foco em confiabilidade e segurança
* Atuar na definição de SLIs, SLOs e SLAs
Requisitos obrigatórios
* Experiência sólida como SRE, DevOps ou Engenharia de Plataforma
* Conhecimento avançado em Microsoft Azure
* Experiência com:
* Kubernetes (AKS)
* Containers (Docker)
* Monitoramento (Datadog, Prometheus, Grafana ou similares)
* Prática com Infrastructure as Code (Terraform, Bicep ou ARM Templates)
* Experiência com pipelines de CI/CD
* Conhecimento em redes, segurança e arquitetura em cloud
* Vivência com troubleshooting em ambientes produtivos de alta criticidade
Diferenciais
* Experiência com Oracle Cloud Infrastructure (OCI)
* Experiência em ambientes multi-cloud
* Conhecimento em práticas de FinOps
* Experiência com sistemas distribuídos de alta escala
* Certificações Azure (AZ-104, AZ-400, etc.)
O que esperamos
* Perfil analítico e pragmático (resolve antes de teorizar demais)
* Senso de dono sobre ambiente produtivo
* Boa comunicação para atuar com times técnicos e não técnicos
* Mentalidade de automação first (se fez manual duas vezes, já está errado)
* Capacidade de trabalhar sob pressão com clareza e organização
O que oferecemos
* Ambiente técnico desafiador com alto volume de dados e crescimento acelerado
* Autonomia para propor melhorias reais (sem burocracia inútil)
* Contato direto com decisões de arquitetura e evolução da plataforma
* Cultura orientada a resultado e melhoria contínua
Modelo de trabalho: Híbrido (2x por semana presencial no escritório da Arctica)