Atuar como Analista III SRE Cloud, contribuindo de forma generalista na sustentação, automação e evolução da infra-base de Cloud da Totvs, garantindo observabilidade, confiabilidade dos serviços e apoio técnico às áreas de Infraestrutura e Arquitetura.
O QUE VOCÊ VAI FAZER:
* Atuar na sustentação, automação e evolução contínua da infraestrutura construindo e dando suporte a uma plataforma de Infra-base de um provedor Cloud, sendo responsável por serviços como DNS, NTP, AD entre outras soluções.
* Sustentar, documentar e evoluir ambientes Cloud e híbridos, buscando resiliência, alta disponibilidade e confiabilidade;
* Entregar e evoluir ferramentas de monitoramento, observabilidade e APM para a infra-base;
* Desenvolver e manter automações operacionais, reduzindo atividades manuais e riscos operacionais;
* Atuar na análise, planejamento e acompanhamento de Incidentes Críticos e problemas, incluindo RCA (Análise de Causa Raiz);
* Participar de escala de plantão (on-call) em revezamento com a equipe;
* Apoiar o time de Arquitetura e outras áreas na tomada de decisões técnicas e arquiteturais;
* Criar e manter documentação técnica e treinamentos hands-on;
* Buscar continuamente novas tecnologias e compartilhar conhecimento com o time;
* Contribuir para criação e acompanhamento de indicadores operacionais (incidentes, SLA, mudanças, automações).
O QUE ESPERAMOS DE VOCÊ:
* Formação: Graduação e (ou) Pós-Graduação na área de tecnologia da informação como Análise de sistemas, Ciência da computação ou Engenharia da computação
* Capacidade de atuar de forma autônoma, proativa e colaborativa;
* Conhecimento avançado em Linux;
* Experiência em ambientes Microsoft (Windows Server, AD);
* Conhecimento intermediário em Redes, Infraestrutura e Segurança;
* Experiência com automação de provisionamento, implantação e escalabilidade (Infraestrutura como Código);
* Conhecimento intermediário em pelo menos uma linguagem como Python ou Go;
* Conhecimento intermediário a avançado em Shell Script, Ansible, Terraform e Packer;
* Experiência em Cloud pública, preferencialmente GCP (ou AWS);
* Conhecimento avançado em logs, monitoramento e observabilidade;
* Conhecimento em processos automatizados de CI/CD;
* Experiência com Git e seus fluxos (branching model, pull requests, releases);
* Conhecimento e domínio de metodologias de governança e agilidade (KanBan).
* Conhecimento em implementação e administração Grafana, Checkmk, Prometheus, Indicadores e construção de KPIs