Transformação de Sistemas - Área de Desempenho Avançado
Aqui, você se tornará um especialista em garantir a confiabilidade e escalabilidade dos sistemas distribuídos. Com foco em automação, orquestração de containers e gerenciamento de configuração, o seu dia a dia será dinâmico.
* Orientar decisões de arquitetura para impulsionar a eficiência do nosso ecossistema de soluções escaláveis, resilientes e seguras.
* Compartilhar conhecimento com outros profissionais de SRE e desenvolvedores para disseminar a cultura DevOps e otimizar os processos.
* Liderar projetos que visam implementar infraestruturas escaláveis, resilientes e seguras, com enfoque em automação e IaC.
* Responsável pela liderança na resolução de incidentes complexos, coordenando ações de resposta, realizando análises de causa raiz e implementando medidas preventivas.
* Desenvolver ferramentas e processos de monitoramento abrangentes para garantir a visibilidade completa do ambiente e a detecção proativa de problemas.
* Analisar e otimizar o desempenho dos sistemas, identificando gargalos e implementando soluções para garantir a escalabilidade e alta disponibilidade.
* Integrar as melhores práticas de segurança em todas as etapas do ciclo de vida dos sistemas, colaborando com a equipe de segurança para garantir a proteção dos dados e conformidade.
* Identificar oportunidades de melhoria nos processos e ferramentas de SRE, buscando a otimização e a automação.
* Trabalhar em conjunto com outras equipes para garantir o alinhamento das soluções e o sucesso das entregas.
O que é necessário para fazer parte da nossa equipe
* Experiência sólida como SRE em ambientes de alta escala e complexidade, com profundo conhecimento em sistemas distribuídos, cloud computing, microsserviços e bancos de dados.
* Domínio de linguagens como Python, Shell script ou Node para automação, criação de ferramentas e desenvolvimento de soluções.
* Proficiência em ferramentas de orquestração de containers (Kubernetes, Docker), CI/CD (Jenkins, GitLab CI), IaC (Terraform, Ansible, CloudFormation), monitoramento (Prometheus, Grafana, Datadog), logging (ex.: Loki e CloudWatch logs) e gerenciamento de configuração.
* Experiência com provedores de nuvem (AWS, Azure, GCP), incluindo serviços de computação, armazenamento, redes e bancos de dados.
* Conhecimento profundo em Linux.
* Compreensão de conceitos de redes (TCP/IP, DNS, roteamento), firewalls, WAF e segurança de aplicações.
* Domínio de padrões de arquitetura (DDD, microsserviços, APIs REST), conceitos de alta disponibilidade, escalabilidade e resiliência.
* Experiência com bancos de dados relacionais e NoSQL, incluindo conceitos de escalabilidade e performance.
* Excelentes habilidades de comunicação para colaborar com equipes multidisciplinares, compartilhando conhecimento e apresentando ideias de forma clara e concisa.
* Iniciativa para identificar e solucionar problemas, propor soluções e implementar melhorias.
O que oferecemos
* Modalidade de contratação CLT;
* Bônus: Recebimento de bônus atrelado ao cumprimento de metas organizacionais;
* Assistência Médica e Odontológica: Cobertura para você e seus dependentes (filhos e cônjuge) pela SulAmérica;
* Vale Refeição e Alimentação: Créditos flexíveis no cartão Caju, podendo ser usados como VR ou VA;
* Auxílio Home Office: Suporte para despesas de trabalho remoto e equipamentos periféricos;
* Auxílio Creche: Para mães e pais;