Sua carreira em SRE
Estamos buscando um profissional experiente para desempenhar o papel de Engenheiro de Confiabilidade e Escalabilidade. Como nosso SRE, você será responsável por garantir a disponibilidade e escalabilidade dos nossos sistemas.
Funções principais:
* Acompanhar a implementação das melhores práticas de confiabilidade, escalabilidade e performance;
* Orientar as decisões de arquitetura e garantir a implementação das soluções mais adequadas;
* Liderar o design e a implementação de soluções de infraestrutura escaláveis, resilientes e seguras, com foco em automação e IaC;
* Assumir a liderança na resolução de incidentes complexos, coordenando as ações de resposta, realizando análises de causa raiz (RCA) e implementando medidas preventivas;
* Definir e implementar ferramentas e processos de monitoramento abrangentes, garantindo a visibilidade completa do ambiente e a detecção proativa de problemas;
* Analisar e otimizar o desempenho dos sistemas, identificando gargalos, implementando soluções para garantir a escalabilidade e a alta disponibilidade;
* Integrar as melhores práticas de segurança em todas as etapas do ciclo de vida dos sistemas, colaborando com a equipe de segurança para garantir a proteção dos dados e a conformidade;
* Identificar e implementar oportunidades de melhoria nos processos e ferramentas de SRE, buscando a otimização e a automação;
* Trabalhar em conjunto com outras equipes (desenvolvimento, produto, segurança) para garantir o alinhamento das soluções e o sucesso das entregas.
Requisitos
* Experiência sólida como SRE em ambientes de alta escala e complexidade, com profundo conhecimento em sistemas distribuídos, cloud computing, microsserviços e bancos de dados;
* Dominio de linguagens como Python, Shell script ou Node para automação, criação de ferramentas e desenvolvimento de soluções;
* Proficiência em ferramentas de orquestração de containers (Kubernetes, Docker), CI/CD (Jenkins, GitLab CI), IaC (Terraform, Ansible, CloudFormation), monitoramento (Prometheus, Grafana, Datadog), logging (ex.: Loki e CloudWatch logs) e gerenciamento de configuração;
* Experiência com provedores de nuvem (AWS, Azure, GCP), incluindo serviços de computação, armazenamento, redes e bancos de dados;
* Conhecimento profundo em Linux;
* Compreensão de conceitos de redes (TCP/IP, DNS, roteamento), firewalls, WAF e segurança de aplicações;
* Dominio de padrões de arquitetura (DDD, microsserviços, APIs REST), conceitos de alta disponibilidade, escalabilidade e resiliência;
* Experiência com bancos de dados relacionais e NoSQL, incluindo conceitos de escalabilidade e performance;
* Excelentes habilidades de comunicação para colaborar com equipes multidisciplinares, compartilhando conhecimento e apresentando ideias de forma clara e concisa;
* Iniciativa para identificar e solucionar problemas, propor soluções e implementar melhorias.
Benefícios
* Modalidade de contratação CLT;
* Bônus: Recebimento de bônus atrelado ao cumprimento de metas organizacionais;
* Assistência Médica e Odontológica: Cobertura para você e seus dependentes (filhos e cônjuge) pela SulAmérica;
* Vale Refeição e Alimentação: Créditos flexíveis no cartão Caju, podendo ser usados como VR ou VA;
* Auxílio Home Office: Suporte para despesas de trabalho remoto e equipamentos periféricos;
* Auxílio Creche: Para mães e pais;