Cargos de responsabilidade e qualificações
Estamos em busca de um(a) profissional para desempenhar o papel fundamental de garantir a estabilidade, performance e resiliência dos nossos ambientes SaaS. Essa pessoa será responsável por aplicar princípios de engenharia de software para resolver desafios operacionais, promovendo uma cultura orientada a dados, automação e confiabilidade.
O objetivo principal desse cargo é assegurar que nossos sistemas estejam sempre disponíveis, performáticos e seguros. Isso envolve definir e acompanhar SLIs/SLOs e indicadores de confiabilidade por produto e ambiente.
* Definição e acompanhamento de SLIs/SLOs
* Design e melhoria contínua de pipelines de observabilidade
* Liderança do processo de incident response
* Colaboração com times de desenvolvimento para garantir a resiliência desde o design da aplicação
* Automatização de tarefas operacionais e gestão de capacidade em ambientes em nuvem
* Participação na construção e disseminação de runbooks, playbooks e estratégias de disaster recovery
* Apoio à cultura de excelência operacional com foco em melhoria contínua, previsibilidade e prevenção de falhas
* Utilização de ferramentas de análise de performance (APM) para diagnóstico e mitigação de gargalos
O candidato ideal deve ter experiência com Ambientes Multi-cloud (OCI e AWS) e suas ferramentas de gestão e automação. Além disso, deve ter sólida experiência em SRE, DevOps ou Engenharia de Produção em ambientes de missão crítica.
Também é necessário ter domínio em práticas de observabilidade: métricas, logs, tracing e alertas. Conhecimento avançado em automação e IaC é também essencial, bem como familiaridade com pipelines de CI/CD e experiência com containers e orquestração.
Requisitos e qualificações
* Experiência em Ambientes Multi-cloud (OCI e AWS)
* Sólida experiência em SRE, DevOps ou Engenharia de Produção
* Domínio em práticas de observabilidade
* Conhecimento avançado em automação e IaC
* Familiaridade com pipelines de CI/CD
* Experiência com containers e orquestração
Benefícios
Nossa empresa oferece benefícios competitivos e um ambiente de trabalho acolhedor. Você terá a oportunidade de trabalhar com uma equipe dedicada e experiente, além de possuir acesso a recursos de treinamento e desenvolvimento.
Estatísticas e contexto
O sistema deve ser capaz de lidar com volumes de dados crescentes e atender às demandas de usuários cada vez mais exigentes. Além disso, é importante garantir a escalabilidade e a flexibilidade do sistema para atender às mudanças no mercado e nas necessidades da empresa.
Para atingir esses objetivos, é necessário adotar uma abordagem orientada a serviços, utilizando tecnologias como microserviços e containerização para melhorar a eficiência e a escalabilidade do sistema.
Ainda assim, é preciso garantir a integridade e a segurança dos dados, bem como a conformidade com regulamentos e padrões de segurança. Para isso, é necessário implementar medidas de segurança robustas, como autenticação, autorização e criptografia, além de realizar testes de segurança regularmente.
Ao mesmo tempo, é importante manter um rigoroso processo de monitoramento e depuração para identificar e resolver problemas rapidamente, evitando impactos significativos nos negócios.