Desenvolvedor SRE
O Desenvolvedor SRE será parte do time de SRE de uma plataforma que disponibiliza serviços de Inteligência Artificial para diversas áreas e possibilita o desenvolvimento de soluções de Agentes de IA integrados a produtos Totvs.
Para este papel, busamos alguém que seja capaz de projetar e operar arquiteturas de alta disponibilidade para micro-serviços Python/FASTAPI, garantindo resiliência, segurança e observabilidade de ponta a ponta. O profissional também deve ser habilidoso em automatizar infraestrutura (IAC) com Terraform e gerenciar ambientes em Kubernetes (GKE) ou Cloud Run, habilitando escalabilidade sob demanda.
Além disso, é necessário criar e manter pipelines CI/CD (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros. O ideal é que o candidato tenha conhecimento em instrumentação e alerta com Prometheus, Grafana, Loki/ELK, Alertmanager.
Os requisitos técnicos incluem experiência prática como SRE/DevOps em ambientes cloud (AWS, GCP ou Azure), domínio de Linux, redes, containers (Docker) e Kubernetes. A proficiência em Infrastructure as Code (Terraform, Pulumi ou CloudFormation) e rotinas de CI/CD com GitHub Actions, GitLab CI, Argo CD ou similares são fundamentais.
Outros benefícios incluem conhecimento de PostgreSQL, Redis e tuning de performance. Além disso, é fundamental ter experiência em gestão de incidentes e elaboração de post-mortems. Diferencial é ter conhecimento em Infraestrutura em Nuvem (Google Cloud Platform), conteinerização (Kubernetes) e serviços serverless.