Responsabilidades e atribuições Atuar na sustentação e evolução de sistemas em produção, sendo responsável por garantir a estabilidade, disponibilidade e rápida recuperação das aplicações, apoiando o time na resolução de incidentes complexos e na melhoria contínua do ambiente. Principais responsabilidades: Atuar no atendimento e gestão de fila de incidentes e requisições (modelo Kanban / ITSM); Investigar, analisar e solucionar incidentes em ambientes produtivos; Realizar troubleshooting de integrações entre sistemas (APIs, filas, serviços distribuídos), identificando falhas, inconsistências e interrupções de processo; Analisar logs, métricas e traces para diagnóstico de problemas e identificação de causa raiz; Apoiar decisões técnicas relacionadas à estabilidade e performance das aplicações; Garantir a disponibilidade e confiabilidade dos sistemas, atuando com foco em SLA/SLO; Participar de situações críticas (war room), apoiando na comunicação técnica e resolução rápida de incidentes; Elaborar e manter runbooks, playbooks e documentação técnica operacional; Realizar análise de causa raiz (RCA) e propor melhorias estruturais para evitar recorrência de incidentes; Automatizar tarefas operacionais e respostas a incidentes (scripts, workflows, bots); Colaborar com times de desenvolvimento, infraestrutura e produto para evolução contínua dos sistemas; Revisar códigos e propor melhorias visando estabilidade, performance e manutenibilidade; Requisitos e qualificações Experiência sólida com sustentação ou manutenção de sistemas em produção; Vivência com atendimento de fila (Kanban) e processos ITSM / ITIL; Experiência com troubleshooting de aplicações e integrações; Domínio em análise de logs e investigação de incidentes; Observabilidade: Experiência com monitoramento e observabilidade (logs, métricas e tracing); Vivência com ferramentas como Datadog, Grafana, Zabbix ou similares; Capacidade de definir e ajustar alertas acionáveis; Desenvolvimento: Experiência com linguagens como Node.js, JavaScript, TypeScript, PHP ou Java; Experiência com frameworks front-end (ex: React.js); Experiência com desenvolvimento e manutenção de sistemas corporativos; Banco de dados: Domínio de bancos relacionais e não relacionais (PostgreSQL, SQL Server, NoSQL): Capacidade de análise e troubleshooting em queries: Infraestrutura: Conhecimento em arquitetura de sistemas distribuídos; Experiência com Docker; Conhecimento prático em processos de Controle de Alteração de Negócios (CAB) e Gerenciamento de Mudanças (GMUD). Conhecimento em Docker, e AWS; Automação: Experiência com automação de processos operacionais (scripts, workflows, etc.); Benefícios Auxílio refeição: 40,00 ao dia; Auxílio Médico; Seguro de vida; Auxílio Odonto; Gympass; Descanso remunerado de 30 dias; Bônus anual;