Atividades:Colaboração com Líderes e Times:• Trabalhar em estreita colaboração com os líderes de equipe para entregar soluções seguras, confiáveis, robustas e escaláveis.• Promover a colaboração entre as equipes de Engenharia de Plataformas e de Tecnologia, garantindo alinhamento nas melhores práticas e objetivos.Implementação de Boas Práticas de SRE:• Identificar e aplicar as melhores práticas de SRE (Site Reliability Engineering) para aprimorar a confiabilidade e o desempenho dos sistemas.• Promover uma cultura de melhoria contínua e aprendizado dentro da equipe.Entrega Contínua e Automação:• Garantir o uso de pipelines e ferramentas de entrega contínua para automatizar totalmente o processo de implantação, testes, entrega e gerenciamento de sistemas de desenvolvimento, QA e produção em diversas plataformas de nuvem.• Desenvolver e manter scripts de automação para otimizar operações e reduzir intervenções manuais.Monitoramento e Gerenciamento de Incidentes:• Implementar soluções de monitoramento abrangentes para detectar e responder proativamente a problemas do sistema.• Assumir a responsabilidade pelo gerenciamento de incidentes, incluindo investigação, análise da causa raiz e implementação de medidas preventivas.• Desenvolver e manter planos de resposta a incidentes, garantindo que a equipe esteja preparada para situações de emergência.Otimização e Ajuste de Desempenho:• Monitorar continuamente o desempenho dos sistemas e implementar otimizações para aumentar a eficiência e a confiabilidade.• Realizar periodicamente ajustes de performance e planejamento de capacidade para garantir que os sistemas possam lidar com o crescimento e a demanda.Inovação e Liderança Técnica:• Manter-se atualizado sobre as mais recentes ferramentas, tecnologias e abordagens na área de SRE.• Inspirar e liderar a equipe a pensar de forma inovadora, desenvolvendo soluções que mantenham a Dentsu à frente do mercado.• Contribuir para a comunidade de SRE, compartilhando conhecimento e melhores práticas.Requisitos da vaga:• Inglês fluente.• Administração de Sistemas UNIX/Linux: Forte experiência em administração de sistemas UNIX/Linux.• Orquestração de Contêineres: Conhecimento avançado em tecnologias de orquestração de contêineres, com ênfase em Kubernetes.• Integração Contínua e Testes Automatizados: Proficiência em práticas de integração contínua e testes automatizados.• Plataformas de CI: Experiência com uma ou mais plataformas populares de CI (ex.: Jenkins, Bamboo, Travis, Brigade).• Gerenciador de Pacotes Helm: Proficiência no uso do Helm para gerenciamento de aplicações em Kubernetes.• Plataformas de Nuvem: Experiência sólida com pelo menos uma grande plataforma de nuvem (ex.: AWS, Azure, Google Cloud).• Gerenciamento de Configuração: Conhecimento em ferramentas de gerenciamento de configuração como Ansible e Terraform.• Redes: Fortes habilidades em redes TCP/IP.• Infraestrutura de Chaves Públicas (PKI): Boa compreensão de PKI e suas aplicações.• Habilidades em Scripting: Domínio de scripts em bash, sh ou ksh.• Linguagens de Programação: Experiência em pelo menos uma linguagem adicional (ex.: Go, JavaScript, Python, Perl).• Gerenciamento do Ciclo de Vida de Versões: Experiência na gestão do ciclo de vida de versões de plataformas e serviços compartilhados, incluindo planejamento, implantação, manutenção e desativação.• Liderança Inovadora: Capacidade de desafiar e propor novas ideias e abordagens.• Defensor da Automação: Paixão por testes automatizados e implantação contínua.• Adaptabilidade: Capacidade de aprender e se adaptar rapidamente a novas técnicas, frameworks e plataformas.• Perfil Versátil: Habilidade para alternar facilmente entre estratégia, liderança, gestão e atividades técnicas práticas.• Comunicação e Colaboração: Excelentes habilidades de comunicação, gestão de stakeholders e trabalho em equipe.