Nós da Lincros, empresa do Grupo Sankhya, temos uma grande oportunidade para você, que quer atuar como SRE Sênior. A Lincros é uma empresa de tecnologia especializada em soluções para gestão logística. Com o TMS mais completo na nuvem do Brasil, ajudamos embarcadores e transportadores a otimizar rotas, reduzir custos e acompanhar operações em tempo real. Nossa missão é descomplicar a logística e impulsionar negócios com eficiência e inovação. Missão do Cargo: O Missão do cargo de SRE III é liderar a confiabilidade, resiliência, escalabilidade e desempenho dos sistemas críticos SAAS da Lincros. O profissional atua como referência técnica na construção de soluções de alta disponibilidade, na automação de processos complexos e na definição de padrões de arquitetura de infraestrutura. Deve promover a cultura SRE e DevOps em toda a organização, sendo peça-chave em incidentes de alta complexidade, análise de performance e iniciativas de melhoria contínua com foco em inovação, eficiência operacional e de custos e segurança da informação de todo o ambiente de Infraestrutura. 1. Responsabilidades e Atribuições Foco na rotina, entrega e impacto no negócio. Disponibilidade e Performance: Monitorar a infraestrutura SaaS para garantir alta disponibilidade, resolvendo problemas de desempenho e confiabilidade em tempo real. Observabilidade: Criar, gerenciar e evoluir ferramentas de monitoramento, alertas e tracing (Zabbix, Grafana, Prometheus). Automação e CI/CD: Automatizar tarefas operacionais e manter pipelines de CI/CD seguros e eficientes. Gestão de Incidentes: Atuar como ponto focal em incidentes críticos, coordenar resoluções com stakeholders e realizar análises de causa raiz (Post-mortem). Arquitetura e Escalabilidade: Projetar arquiteturas escaláveis, tolerantes a falhas e com foco em custo-benefício. Cultura e Governança: Apoiar a evolução da cultura DevOps/SRE, participar de comitês de arquitetura (CABs) e gerenciar SLOs, SLIs e Error Budgets. Segurança e Continuidade: Definir políticas de segurança em nuvem e criar planos de Disaster Recovery. Mentoria e Conhecimento: Mentorar outros membros do time, realizar workshops e manter a documentação técnica (Wiki) atualizada. Operação: Atuar em regime de plantão 24/7 conforme escala estabelecida. 2. Requisitos e Qualificações Foco nas competências técnicas e experiências necessárias. Experiência com Cloud & Infra: Sólidos conhecimentos em infraestrutura SaaS e arquitetura de sistemas distribuídos. Ferramentas de Observabilidade: Domínio em Zabbix, Grafana, Prometheus, ELK stack ou ferramentas similares de logs e tracing. Infraestrutura como Código (IaC): Experiência prática com Terraform e Ansible. Programação e Scripting: Domínio de Python, Shell Script ou linguagens equivalentes para automação avançada. DevOps: Experiência com ferramentas de CI/CD e esteiras de deploy automatizadas. Conceitos de SRE: Conhecimento profundo em métricas de confiabilidade (SLI, SLO, SLA) e gestão de incidentes. Segurança e Redes: Noções de políticas de segurança em nuvem e protocolos de rede. Soft Skills: Liderança técnica, comunicação clara para gestão de crises e perfil protagonista. Formação: Graduação em Tecnologia da Informação, Engenharia de Software ou áreas correlatas (ou experiência equivalente de mercado). Formação completa em tecnologia da informação e afins. Localidade | Atuação Blumenau/SC : Híbrido Outros estados: 100% remoto Informações adicionais