Estamos em busca de um(a) Site Reliability Engineer (SRE) Sênior para fortalecer a base técnica que sustenta nossa plataforma de dados financeiros. Como SRE na Gorila, você será peça-chave na construção e evolução de uma infraestrutura escalável, observável e resiliente, garantindo que nossos sistemas possam crescer com segurança e agilidade — sem perder o foco em qualidade, performance e confiabilidade.
Você atuará diretamente no suporte à nossa missão: entregar clareza e controle para investidores e instituições através de dados financeiros bem tratados, acessíveis e confiáveis. Isso significa garantir que os pipelines de dados estejam sempre disponíveis, que os sistemas sejam fáceis de operar e monitorar, e que o time de engenharia possa inovar com autonomia e confiança.
No dia a dia, você será responsável por liderar iniciativas de automação, infraestrutura como código, práticas de GitOps e observabilidade, utilizando ferramentas como Kubernetes (EKS), ArgoCD, Crossplane, Istio, Grafana e Prometheus. Seu trabalho será essencial para garantir que nossa plataforma continue sendo uma referência em confiabilidade, tanto para investidores individuais quanto para grandes instituições financeiras que consomem nossos dados via integrações e APIs.
Responsabilidades
Projetar, implementar e manter a infraestrutura baseada em AWS e Kubernetes (EKS)
Criar e gerenciar pipelines de CI/CD utilizando GitHub Actions e ArgoCD
Implementar e gerenciar observabilidade com Grafana, Prometheus, Loki e Tempo
Garantir a segurança e conformidade da infraestrutura, incluindo controle de acesso, rede e comunicação entre serviços com Istio
Automatizar a criação e gerenciamento de recursos na AWS com Terraform, Crossplane e Kustomization
Requisitos Obrigatórios:
Experiência com AWS e serviços como EKS, RDS, IAM, S3, entre outros
Conhecimento sólido em redes, protocolos de comunicação, incluindo TCP/IP, DNS, HTTP, TLS e roteamento
Forte conhecimento em Kubernetes e ferramentas de gerenciamento de infraestrutura
Experiência com ArgoCD e GitOps
Conhecimento avançado em observabilidade e tracing distribuído
Experiência com Istio ou outra solução de Service Mesh
Experiência com automação e infraestrutura como código (Crossplane, Kustomization, Terraform, etc.)
Conhecimento em CI/CD com GitHub Actions ou similares
Experiência em troubleshooting e otimização de PostgreSQL em produção
Conhecimento em scripting (Bash, Python ou Go) para automação
Experiência com práticas de FinOps
Diferenciais:
Experiência com security hardening em ambientes Kubernetes
Experiência com Open Policy Agent ou similares
Experiência com banco de dados PostgreSQL, garantindo alta disponibilidade e otimização de desempenho
Experiência em gerenciamento de Operadores de Bancos de Dados no Kubernetes como CloudNativePG e Zalando