Missão:
Sua missão será garantir a confiabilidade, escalabilidade e performance das infraestruturas e aplicações de nossos clientes, atuando de forma proativa na implementação de soluções eficientes de monitoramento, otimização de custos e estabilidade dos serviços.
Perfil desejado:
Buscamos uma pessoa SRE generalista, com olhar estratégico e técnico, que possa atuar de forma transversal com foco em observabilidade, FinOps e automation. A principal responsabilidade será colaborar com equipes multifuncionais para estruturar e evoluir práticas que garantam ambientes resilientes, eficientes e sustentáveis, apoiando tanto a operação quanto o desenvolvimento contínuo das soluções.
Responsabilidades:
1. Colaborar com equipes envolvidas no projeto / poc / sustentação / serviços internos;
2. Atender demandas do cliente (dentro de um ecossistema ágil);
3. Implementar e configurar monitoramentos detalhados utilizando as melhores ferramentas, garantindo visibilidade em tempo real da performance e saúde dos sistemas e aplicações.
4. Definir e acompanhar métricas e alertas, integrando ferramentas e fluxos de trabalho para otimizar o tempo de resposta a incidentes e assegurar a estabilidade dos serviços em produção.
5. Implementar FinOps através das melhores ferramentas, otimizando custos e garantindo eficiência no uso de recursos.
6. Gerenciar Código Fonte (git), garantindo boas práticas de versionamento e colaboração na equipe;
7. Orquestrar Contêineres (Docker, Kubernetes, Terraform), projetando e mantendo arquiteturas baseadas em contêineres, garantindo alta disponibilidade e escalabilidade com Kubernetes;
8. Projetar e manter pipelines de CI/CD eficazes, automatizando testes, integração e implantação contínua;
9. Selecionar, implementar e manter ferramentas de CI/CD alinhadas com os requisitos do projeto;
10. Projetar, implantar e manter serviços em nuvem em plataformas como AWS, GCP e outras;
11. Configurar proxies e equilibradores de carga para otimizar o desempenho e a resiliência;
12. Implementar e manter soluções de monitoramento e logging para garantir a visibilidade operacional;
13. Participar de troubleshooting de networking (triagem, packet loss e roteamento);
14. Desenvolver scripts e automações usando linguagens como bash, PowerShell.
Requisitos:
* Experiência com ferramentas de observabilidade;
* Vivência sólida em FinOps;
* Atuação com sistemas distribuídos (arquiteturas, micro-serviços, alta disponibilidade, eleições);
* Administração de containers e serviços em nuvem;
* Configuração e gerenciamento de proxies e load balancing (Nginx, HAProxy, Envoy);
* Experiência com logging (como Splunk, SysLog, ELK Stack, Linux Journal e/ou grep);
* Versionamento de código e práticas de CI/CD;
* Sólido conhecimento em Linux (bash, debugging);
* Networking (triagem, packet loss, routing);
* Experiência com scripting em Bash e/ou PowerShell;
* Background na área de engenharia de software/desenvolvimento.
Diferenciais:
* Experiência em FinOps com Cloudability e Turbonomic;
* Gerenciamento de infraestrutura com Apptio;
* Experiência com Datadog, OpenTelemetry, Instana, Grafana, Elastic APM, Prometheus, Kibana e Elasticsearch;
* Treinamentos IBM e Datadog relevantes, como:
o IBM Application Performance Monitoring (APM);
o IBM Cloudability ou Premium Cloudability;
o Turbonomic;
o Apptio;
o OpenTelemetry;
o Datadog observabilidade.
Benefícios e Cultura:
* Trabalho 100% remoto, com liberdade e responsabilidade;
* Cultura de desenvolvimento com avaliações de desempenho e planos de crescimento;
* Programas de saúde, bem-estar, e equilíbrio entre vida pessoal e profissional;
* Iniciativas de colaboração, reconhecimento e benefícios diversos.
Mais informações e o compromisso com a diversidade estão disponíveis no Aviso de Privacidade - Processo de Recrutamento.
Aqui na Evoluum valorizamos a liberdade de ser você, promovendo um ambiente inclusivo e diverso, onde todas as identidades e atributos são respeitados e valorizados.
#J-18808-Ljbffr