Responsabilidades e atribuições:
Implementar e evoluir a infraestrutura cloud-native, seguindo as arquiteturas de referência existentes.
Automatizar o provisionamento de infraestrutura por meio de Infrastructure as Code.
Desenvolver e manter código em Python para automações, ferramentas internas, integrações e apoio às operações da plataforma.
Implementar e manter SLOs, SLIs e dashboards, seguindo padrões definidos pela plataforma.
Padronizar e manter a coleta de métricas, logs e traces nos serviços da plataforma.
Criar e manter playbooks operacionais e runbooks.
Implementar estratégias de deploy seguro, como blue/green ou canary, quando aplicável.
Evoluir e manter pipelines de CI/CD, garantindo estabilidade, qualidade e rastreabilidade.
Atuar em incident response, participando de escalas de on-call, mitigação e análises pós-incidente (blameless post-mortems).
Implementar práticas de SSDLC e validações de segurança nos pipelines.
Aplicar controles de segurança e compliance definidos (IAM, network policies, secrets, Policy-as-Code).
Apoiar a modelagem e manutenção de topologias de rede em nuvem, como VPCs, peering e load balancers.
Requisitos e qualificações:
Experiência sólida em Cloud Computing, com Kubernetes e serviços gerenciados em AWS, Azure ou GCP.
Experiência prática com Infrastructure as Code (Terraform).
Experiência com pipelines de CI/CD (Git Hub Actions, Git Lab CI, Jenkins).
Vivência em ambientes produtivos de média a alta criticidade.
Conhecimento prático em observabilidade (métricas, logs e traces).
Conhecimentos de segurança em cloud (IAM, redes, secrets).
Capacidade de análise e troubleshooting em ambientes distribuídos.
Experiência em documentação técnica, como runbooks, diagramas simples e ADRs.