Atividades: Colaboração com Líderes e Times: • Trabalhar em estreita colaboração com os líderes de equipe para entregar soluções seguras, confiáveis, robustas e escaláveis.
• Promover a colaboração entre as equipes de Engenharia de Plataformas e de Tecnologia, garantindo alinhamento nas melhores práticas e objetivos.
Implementação de Boas Práticas de SRE:
• Identificar e aplicar as melhores práticas de SRE (Site Reliability Engineering) para aprimorar a confiabilidade e o desempenho dos sistemas.
• Promover uma cultura de melhoria contínua e aprendizado dentro da equipe.
Entrega Contínua e Automação:
• Garantir o uso de pipelines e ferramentas de entrega contínua para automatizar totalmente o processo de implantação, testes, entrega e gerenciamento de sistemas de desenvolvimento, QA e produção em diversas plataformas de nuvem.
• Desenvolver e manter scripts de automação para otimizar operações e reduzir intervenções manuais.
Monitoramento e Gerenciamento de Incidentes:
• Implementar soluções de monitoramento abrangentes para detectar e responder proativamente a problemas do sistema.
• Assumir a responsabilidade pelo gerenciamento de incidentes, incluindo investigação, análise da causa raiz e implementação de medidas preventivas.
• Desenvolver e manter planos de resposta a incidentes, garantindo que a equipe esteja preparada para situações de emergência.
Otimização e Ajuste de Desempenho:
• Monitorar continuamente o desempenho dos sistemas e implementar otimizações para aumentar a eficiência e a confiabilidade.
• Realizar periodicamente ajustes de performance e planejamento de capacidade para garantir que os sistemas possam lidar com o crescimento e a demanda.
Inovação e Liderança Técnica:
• Manter-se atualizado sobre as mais recentes ferramentas, tecnologias e abordagens na área de SRE.
• Inspirar e liderar a equipe a pensar de forma inovadora, desenvolvendo soluções que mantenham a Dentsu à frente do mercado.
• Contribuir para a comunidade de SRE, compartilhando conhecimento e melhores práticas.
Requisitos da vaga:
• Inglês fluente.
• Administração de Sistemas UNIX/Linux: Forte experiência em administração de sistemas UNIX/Linux.
• Orquestração de Contêineres: Conhecimento avançado em tecnologias de orquestração de contêineres, com ênfase em Kubernetes.
• Integração Contínua e Testes Automatizados: Proficiência em práticas de integração contínua e testes automatizados.
• Plataformas de CI: Experiência com uma ou mais plataformas populares de CI (ex.: Jenkins, Bamboo, Travis, Brigade).
• Gerenciador de Pacotes Helm: Proficiência no uso do Helm para gerenciamento de aplicações em Kubernetes.
• Plataformas de Nuvem: Experiência sólida com pelo menos uma grande plataforma de nuvem (ex.: AWS, Azure, Google Cloud).
• Gerenciamento de Configuração: Conhecimento em ferramentas de gerenciamento de configuração como Ansible e Terraform.
• Redes: Fortes habilidades em redes TCP/IP.
• Infraestrutura de Chaves Públicas (PKI): Boa compreensão de PKI e suas aplicações.
• Habilidades em Scripting: Domínio de scripts em bash, sh ou ksh.
• Linguagens de Programação: Experiência em pelo menos uma linguagem adicional (ex.: Go, JavaScript, Python, Perl).
• Gerenciamento do Ciclo de Vida de Versões: Experiência na gestão do ciclo de vida de versões de plataformas e serviços compartilhados, incluindo planejamento, implantação, manutenção e desativação.
• Liderança Inovadora: Capacidade de desafiar e propor novas ideias e abordagens.
• Defensor da Automação: Paixão por testes automatizados e implantação contínua.
• Adaptabilidade: Capacidade de aprender e se adaptar rapidamente a novas técnicas, frameworks e plataformas.
• Perfil Versátil: Habilidade para alternar facilmente entre estratégia, liderança, gestão e atividades técnicas práticas.
• Comunicação e Colaboração: Excelentes habilidades de comunicação, gestão de stakeholders e trabalho em equipe.