Descrição do Cargo
Como especialista em segurança e confiabilidade de sistemas, você trabalhará em estreita colaboração com os líderes de equipe para entregar soluções escaláveis e robustas.
Além disso, você promoverá a colaboração entre as equipes de Engenharia de Plataformas e de Tecnologia, garantindo alinhamento nas melhores práticas e objetivos.
Atividades Principais:
1. Trabalho em Equipe: Colaborar com os líderes de equipe para desenvolver soluções eficazes e escaláveis.
2. Colaboração Interdepartamental: Promover a colaboração entre as equipes de Engenharia de Plataformas e de Tecnologia.
3. Implementação de Boas Práticas de SRE: Identificar e aplicar as melhores práticas de SRE para aprimorar a confiabilidade e o desempenho dos sistemas.
4. Entrega Contínua e Automação: Garantir o uso de pipelines e ferramentas de entrega contínua para automatizar totalmente o processo de implantação, testes, entrega e gerenciamento de sistemas de desenvolvimento, QA e produção em diversas plataformas de nuvem.
5. Monitoramento e Gerenciamento de Incidentes: Implementar soluções de monitoramento abrangentes para detectar e responder proativamente a problemas do sistema.
6. Otimização e Ajuste de Desempenho: Monitorar continuamente o desempenho dos sistemas e implementar otimizações para aumentar a eficiência e a confiabilidade.
Habilidades e Experiências Requeridas
1. Administração de Sistemas UNIX/Linux: Forte experiência em administração de sistemas UNIX/Linux.
2. Orquestração de Contêineres: Conhecimento avançado em tecnologias de orquestração de contêineres, com ênfase em Kubernetes.
3. Integração Contínua e Testes Automatizados: Proficiência em práticas de integração contínua e testes automatizados.
4. Plataformas de CI: Experiência com uma ou mais plataformas populares de CI (ex.: Jenkins, Bamboo, Travis, Brigade).
5. Gerenciador de Pacotes Helm: Proficiência no uso do Helm para gerenciamento de aplicações em Kubernetes.
6. Plataformas de Nuvem: Experiência sólida com pelo menos uma grande plataforma de nuvem (ex.: AWS, Azure, Google Cloud).
7. Gerenciamento de Configuração: Conhecimento em ferramentas de gerenciamento de configuração como Ansible e Terraform.
8. Redes: Fortes habilidades em redes TCP/IP.
9. Infraestrutura de Chaves Públicas (PKI): Boa compreensão de PKI e suas aplicações.
10. Habilidades em Scripting: Domínio de scripts em bash, sh ou ksh.
11. Linguagens de Programação: Experiência em pelo menos uma linguagem adicional (ex.: Go, JavaScript, Python, Perl).
12. Gerenciamento do Ciclo de Vida de Versões: Experiência na gestão do ciclo de vida de versões de plataformas e serviços compartilhados, incluindo planejamento, implantação, manutenção e desativação.
13. Liderança Inovadora: Capacidade de desafiar e propor novas ideias e abordagens.
14. Defensor da Automação: Paixão por testes automatizados e implantação contínua.
15. Adaptabilidade: Capacidade de aprender e se adaptar rapidamente a novas técnicas, frameworks e plataformas.
16. Perfil Versátil: Habilidade para alternar facilmente entre estratégia, liderança, gestão e atividades técnicas práticas.
17. Comunicação e Colaboração: Excelentes habilidades de comunicação, gestão de stakeholders e trabalho em equipe.