Emprego
Meus anúncios
Meus alertas e-mail de emprego
Fazer login
Encontrar um emprego Dicas de emprego Fichas de empresas
Pesquisar

Especialista em manutenção de sistemas

Presidente Prudente
beBeeDesenvolvedor
Manutenção
Anunciada dia 4 outubro
Descrição

Descubra o seu papel em nossa equipe de SRE.

Nossa plataforma oferece serviços de Inteligência Artificial para diversas áreas e possibilita o desenvolvimento de soluções de agentes de IA integrados a produtos TOTVS.

O profissional nessa posição fará parte do time de SRE e trabalhará no núcleo estratégico da companhia, servindo diversas áreas da mesma, incluindo clientes internos e externos.

Caderno de Objetivos:

* Projetar e operar arquiteturas de alta disponibilidade para micro-serviços Python/FastAPI, garantindo resiliência, segurança e observabilidade de ponta a ponta.
* Automatizar infraestrutura (IaC) com Terraform e gerenciar ambientes em Kubernetes (GKE) ou Cloud Run, habilitando escalabilidade sob demanda.
* Criar e manter pipelines CI/CD (GitHub Actions, Argo CD, etc.) que promovam builds, testes, deploy e rollback seguros.
* Implementar e evoluir SLIs/SLOs; instrumentar serviços com Prometheus, Grafana, OpenTelemetry e rastreabilidade distribuída.
* Monitorar, diagnosticar e otimizar bancos SQL (Postgres), caches (Redis) e bases vetoriais, focando em desempenho e custo.
* Conduzir resposta a incidentes: alerta, mitigação, post-mortem, ações preventivas.
* Capacitar o time: disseminar boas práticas de confiabilidade, revisão de arquitetura, pairing e documentação contínua.
* Participar do plantão (on-call) rotativo, mantendo a plataforma com o máximo de disponibilidade possível.

Habilidades Requisitadas:

* Experiência prática como SRE/DevOps em ambientes cloud (AWS, GCP ou Azure).
* Dominio de Linux, redes, containers (Docker) e Kubernetes.
* Proficiência em Infrastructure as Code (Terraform, Pulumi ou CloudFormation).
* Rotinas de CI/CD com GitHub Actions, GitLab CI, Argo CD ou similares.
* Instrumentação e alerta com Prometheus, Grafana, Loki/ELK, Alertmanager.
* Programação/scripting em Python e Bash (Go é bônus).
* Conhecimento de Postgres, Redis e tuning de performance.
* Experiência em gestão de incidentes e elaboração de post-mortems.
* Inglês técnico para leitura e escrita.

Benefícios:

* Conhecimento em infraestrutura em nuvem (Google Cloud Platform), conteinerização (Kubernetes) e serviços serverless.
* Experiência com Cloud Run, Knative ou FaaS.
* Noções de cost optimisation em FinOps.
* Contribuições open-source em projetos Cloud Native.
* Experiência com ferramentas de monitoramento e observabilidade, como Prometheus e Grafana.
* Familiaridade com pipelines de CI/CD.
* Conhecimento em infraestrutura como código (IaC), como Terraform.
* Experiência com agentes de IA, LLMs e RAG.
* Conhecimento em protocolos de rede, como TCP/IP e
* Experiência com proxy reverso e balanceamento de carga.

Se candidatar
Criar um alerta
Alerta ativado
Salva
Salvar
Vaga parecida
Técnico de instalação e manutenção
Presidente Prudente
WEBBY TELECOM LTDA
Manutenção
Vaga parecida
Eletricista de montagem e manutenção i (21)
Presidente Prudente
Energisa
Manutenção
Vaga parecida
320 - programador e operador de máquinas cnc (4)
Presidente Prudente
TMatheaço
Operador de máquina
Vagas parecidas
Emprego Indústria em Presidente Prudente
Emprego Presidente Prudente
Emprego São Paulo
Emprego Sudeste
Página principal > Emprego > Emprego Indústria > Emprego Manutenção > Emprego Manutenção em Presidente Prudente > Especialista em Manutenção de Sistemas

Jobijoba Brasil

  • Dicas de emprego

Encontre vagas

  • Vagas de emprego por cargo
  • Pesquisa de vagas de emprego por área
  • Empregos por empresas
  • Empregos por localização

Contato / Parceria

  • Entre em contato
  • Publique suas ofertas no site Jobijoba

Menções legais - Menções legais e termos de uso - Política de dados - Gerir os meus cookies - Acessibilidade: Não conforme

© 2025 Jobijoba Brasil - Todos os direitos reservados

Se candidatar
Criar um alerta
Alerta ativado
Salva
Salvar