Considerado um dos mais críticos papéis em nossa organização, o SRE (Site Reliability Engineering) desempenha uma função essencial na garantia da disponibilidade e confiabilidade do sistema.
O profissional escolhido para esta posição estará responsável por projetar, automatizar e otimizar arquiteturas escaláveis e seguras utilizando tecnologias como IaC (Terraform, CloudFormation).
Ao realizar a gestão de infraestrutura na AWS, ele precisará alinhar práticas de FinOps com o objetivo de controlar gastos e garantir conformidade regulatória.
Mais do que isso, é preciso ter expertise em estratégias de otimização de custos, análise de padrões de uso na AWS e colaboração com equipes de negócios para práticas financeiras eficientes.
Somamos à lista habilidades técnicas como domínio dos principais serviços da AWS, arquiteturas escaláveis e seguras, e práticas de otimização de custos e governança.
No entanto, não basta apenas conhecer as ferramentas e tecnologias. É necessário possuir sólidos conhecimentos de redes, incluindo conceitos de IP, LAN, WAN, subnetting e CIDR.
E, claro, é fundamental experiência em configurar e gerenciar endereços IP (Elastic IP, Private IP e Public IP) na AWS.
Já no que diz respeito ao monitoramento e observabilidade, será necessário configurar monitoramento, criar dashboards e alertas proativos integrando Datadog com AWS para visibilidade abrangente.
Também é importante implementar práticas de DevSecOps, automatizando segurança em pipelines CI/CD e garantindo conformidade com padrões de segurança.
E, para finalizar, a pessoa certa deverá dispor de habilidades de resolução de problemas e gerenciamento de incidentes, diagnosticando e resolvendo incidentes rapidamente e implementando melhorias pós-incidente.