Descrição da vaga
Quando você pensa em carreira, o que vem à sua mente? Propósito? Colaboração? Ser protagonista para fazer a diferença? No PagBank temos tudo isso e muito mais.
Estamos em busca de pessoas que vistam a camisa com orgulho. Gente com vontade de facilitar a vida financeira das pessoas e impulsionar negócios!
Tá a fim de uma carreira que rende mais?Confira essa oportunidade e #VemProPags!
Responsabilidades e atribuições
Desenhar e manter observabilidade fim a fim (logs, métricas, traces) usando, Grafana e Prometheus, com painéis e alertas.
Administrar e evoluir alertas (thresholds, regras, correlação) e implementar runbooks para respostas padronizadas.
Responder a incidentes (triagem, diagnóstico, mitigação, comunicação) e conduzir postmortems com ações estruturadas para reduzir MTTR e recorrência.
Troubleshooting avançado em produção (análise de logs, profiling, traces distribuídos, p99, saturação/latência/erros) e tuning de SO Unix e JVM.
Capacity & performance management (dimensionamento, previsão de demanda, testes de performance), com foco em custo/benefício.
Administrar e otimizar serviços AWS: EC2, VPC, S3, CloudWatch, ACM, IAM.
Orquestração com Kubernetes/EKS/ECS: policies, quotas, requests/limits, autoscaling (HPA/VPA), ASG, e observabilidade de workloads.
Edge e entrega: CloudFront (cache, TTL, compressão) e integrações com WAF.
Requisitos e qualificações
Experiência com monitoração e observação de ambientes complexos utilizando ferramentas como Splunk, Grafana e Prometheus.
Experiência com troubleshoot (capacidade de inspecionar sistemas e problemas).
Experiência com redes (DNS, HTTP, roteamento, TCP/IP, Firewall, WAF).
Experiência com sistema operacional Unix: troubleshoot de ambiente, tuning, ferramentas de operação e administração.
Experiência com arquitetura de sistemas: alta disponibilidade, resiliência, segurança, custo/benefício e ambientes híbridos.
Experiência com Internet: protocolos e principais tecnologias.
Experiência com segurança: criptografia, LGPD e conhecimento dos processos e padrões da companhia.
Experiência com Java: configuração e administração de Java environment e principais ferramentas da JVM.
Informações adicionais
Para se destacar nesta posição seria legal se você também tivesse
Conhecimento em ambiente Multicloud e Datacenter.
Conhecimento em AWS: S3, EKS, ASG, Lambda, CloudFront, CloudWatch, EC2, VPC, ECS, ACM e IAM.
Conhecimento em administração de containers (Docker e Kubernetes).
Conhecimento em IaC: Técnicas e proficiência para administração de ambientes automatizados (Ansible, Terraform).
Conhecimento em engenharia e desenvolvimento de software/programação.
Conhecimento em metodologias ágeis e fluxos de trabalho otimizados.
#J-18808-Ljbffr