Profisisonal será responsável por garantir que nossos sistemas críticos rodem com alta disponibilidade, baixa latência e máxima confiabilidade, liderando iniciativas que impactam diretamente a experiência de milhões de consumidoresConduzir triagem e direcionamento técnico de tickets (Incidentes, Problemas, Requisições e Changes), assegurando qualidade, rastreabilidade e priorização;Atuar em incidentes críticos (P1), coordenando mitigação, comunicação técnica e ações de contenção;Realizar RCA (análise de causa raiz) e definir planos de ação para redução de reincidência e melhoria de estabilidade;Projetar e implementar correções e melhorias em (Koa) / TypeScript, garantindo padrões de arquitetura, testes e boas práticas;Evoluir integrações e fluxos assíncronos com Kafka, e otimizar pipelines de processamento e reprocesso quando necessário;Garantir performance e confiabilidade das camadas de dados e busca (MongoDB, Redis, Elasticsearch/Kibana), em parceria com infraestrutura/DevOps quando aplicável;Apoiar boas práticas de observabilidade e debugging (logs, métricas e tracing), acelerando diagnóstico e reduzindo MTTR;Realizar code reviews, orientar o time no dia a dia, e promover consistência técnica (patterns, guidelines, definição de pronto, quality gates);Apoiar a governança de mudanças e releases (janelas, rollback, validação), reduzindo risco operacional.Habilidades:Experiência com desenvolvimento de software em ambiente de produção;Domínio de com TypeScript (back-end) e experiência com Koa (ou frameworks equivalentes);Vivência com bancos e componentes de alta demanda: MongoDB, Redis e Elasticsearch (consulta, modelagem, performance e troubleshooting);Experiência com arquitetura orientada a eventos e/ou mensageria (Kafka);Familiaridade com Docker e rotinas de deploy/operabilidade em ambientes containerizados;Capacidade de atuar em ambiente de sustentação com governança (SLA, incident management, RCA, changes); Experiência sólida como Tech Lead ou Senior com atuação forte em liderança técnica;Boa comunicação para conduzir incidentes, alinhar prioridades e influenciar decisões técnicas com diferentes stakeholders.Capacidade de atuar sob pressão em incidentes críticos.Mentalidade de SRE (Site Reliability Engineering), buscando confiabilidade e automação.Colaboração e orientação de equipe, promovendo excelência técnica.Diferenciais:Experiência com React (BFF/Front, troubleshooting em produção e integração com APIs);Vivência com Kibana e práticas avançadas de observabilidade (dashboards, correlação de eventos, alertas);Experiência prévia com operação de sistemas críticos / varejo / omnichannel;Conhecimento em padrões de resiliência (retry, circuit breaker, idempotência, DLQ, backpressure) aplicados a integrações/eventos;Participação em desenhos de arquitetura e melhoria de confiabilidade (SRE mindset).